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内 容 提 要 


本 书 是 计算 机 科学 概论 课程 的 经 典 教材 ， 全 书 对 计算 机 科学 做 了 百科 全 书 式 的 精彩 阐述 ， 充 分 展现 了 
计算 机 科学 的 历史 背景 、 发 展 历程 和 新 的 技术 趋势 。 本 书 首先 介绍 的 是 信息 编码 及 计算 机 体系 结构 的 基本 
原理 〈 第 1 章 和 第 2 章 )， 进 而 讲述 操作 系统 〈 第 3 章 ) 和 组 网 及 因特网 (第 4 章 )， 接 着 探讨 了 算法 、 程 
序 设计 语言 及 软件 工程 〈 第 5 章 至 第 7 章 )， 然 后 讨论 数据 抽象 和 数据 库 〈 第 8 章 和 第 9 章 ) 方面 的 问题 ， 
第 10 章 通过 图 形 学 讲述 计算 机 技术 的 一 些 主要 应 用 ， 第 11 章 涉及 人 工 智能 ， 第 12 章 通过 对 计算 理论 的 
介绍 来 结束 全 书 。 本 书 在 内 容 编排 上 由 具体 到 抽象 逐步 推进 ， 很 适合 教学 安排 ， 每 一 个 主题 自然 而 然 地 引 
陡 出 下 一 个 主题 。 此 外 ， 书 中 还 包含 大 量 的 图 、 表 和 实例 ， 有 助 于 读者 对 知识 的 了 解 与 把 握 ， 


本 书 适 合作 为 高 等 院 校 计算 机 以 及 相关 专业 本 科 生 的 教材 。 
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本 书 是 计算 机 科学 的 入 门 教材 。 在 力求 保持 学 科 广 度 的 同时 ， 还 兼顾 主题 的 次 度 ， 同 时 也 
将 对 所 涉及 的 主题 给 出 中 肯 的 评价 。 


和 和 


TH 让 二 全 和 本 下 下 下 汪 上 让 下 


本 书面 癌 计算 机 科学 以 及 其 他 各 个 学 科 的 学 生 。 大 多 数 计算 机 科学 专业 的 学 生 在 最 初 的 学 
习 中 都 有 这 样 一 个 误解 ， 认 为 计算 机 科学 就 是 程序 设计 和 浏览 网 页 ， 因 为 这 基本 上 就 是 他 们 所 
看 到 的 一 切 。 实 际 上 计算 机 科学 远 非 如 此 。 因 此 ， 在 入 门 阶 段 ， 学 生 们 需要 了 解 他 们 主攻 的 这 
门 学 科 所 涉及 内 容 的 广度 ， 这 也 正 是 本 书 的 宗 上 由 。 本 书 使 学 生 对 计算 机 科学 有 一 个 总 体 的 概 
念 一 一 在 这 个 基础 上 ， 他 们 可 以 诺 熟 该 领域 今后 其 他 课程 的 特点 以 及 课程 之 间 的 相互 关系 。 事 
实 上 ， 本 书 采 用 的 综述 方式 也 是 自然 科学 入 门 教程 的 常见 模式 。 

其 他 学 科 的 学 生 如 果 想 融入 这 个 技术 化 社会 ， 也 需要 具备 这 些 宽泛 的 知识 背景 。 适 用 于 他 
们 的 计算 机 科学 课程 提供 的 应 该 是 对 整个 领域 很 实用 的 剖析 ， 而 不 仅仅 是 培训 学 生 如 何 上 网 和 
便 用 一 些 流 行 的 软件 。 当 然 这 种 培训 也 有 其 适用 的 地 方 ， 而 本 书 的 目的 是 用 作 教科 书 。 正 如 一 
铝 中国 谚语 所 说 :“ 授 人 以 鱼 ， 不 如 授 人 以 渔 。” 

内 此 , 在 写 这 本 书 时 ， 保 持 对 学 生 的 可 读 性 是 主要 目标 。 这 样 做 的 结果 是 先前 的 9 个 版 本 已 
经 很 成 功 地 作为 教科 书 广 为 使 用 , 读者 包括 从 高 中 生 到 研究 生 的 各 个 教育 层次 众多 专业 的 学 生 。 
本 版 仍 将 贯彻 这 一 目标 。 


本 


第 10 版 最 大 的 变化 是 新 增 了 关于 计算 机 图 形 学 的 一 章 《 第 10 章 )， 这 一 章 的 大 部 分 内 容 集 中 
在 3D 图 形 学 方面 ， 也 就 是 如 何 对 三 维 现实 世界 的 抽象 模型 进行 编码 ， 然 后 用 来 生成 二 维 图 像 。 
这 一 章 的 主题 是 视频 游戏 和 当今 电影 产业 中 使 用 的 技术 。 总 体 来 说 ， 这 一 章 为 了 解 虚拟 现实 的 
扩展 领域 打下 了 一 个 基础 。 我 喜欢 编写 这 类 题材 ， 希 望 你 能 在 其 中 找到 想 要 的 知识 并 能 发 现 有 
趣 之 处 。 

你 也 会 发 现 第 4 章 〈 组 网 及 因特网 ) 和 第 7 章 〔〈 软 件 工程 ) 中 的 一 些 重要 变化 。 更 确切 地 
讲 ， 关 于 组 网 的 许多 内 容 都 已 更 新 ， 关 于 因特网 结构 的 讨论 是 从 因特网 服务 提供 商 的 现代 视 
角 【 而 不 是 从 互 连 领域 的 视角 ) 重 写 的 。 至 于 第 7 章 ， 除 了 整体 的 更 新 外 ， 还 包 依 了 关于 人 机 
界面 的 内 容 。 

第 10 版 中 的 另 一 个 变化 不 明显 , 但 也 许 比 前 面 所 提 及 的 更 有 意义 。 这 就 是 本 书 的 组 稿 方式 。 
具体 地 讲 ， 第 10 版 借鉴 了 许多 其 他 作者 在 各 自 领 域 上 的 专业 经 验 。 他 们 出 版 的 教材 大 家 耳 熟 能 
话 且 三 受 好 评 ,这些 教 材 收集 在 Addison-Wesley 的 计算 机 科学 教材 系列 的 书 中 。 这些 作 者 分 别 是 
EdAngel 《计算 机 图 形 学 )、John Carmpineli 《计算 机 体系 结构 )、Chris Fox〈 软 件 工程 )、Jim Kurose 


前 言  W 





(组 网 及 因特网 )、Garv Nutt〈 操 作 系统 )、Greg Riccardi 〈 数 据 库 系统 ) 和 Patrick Henry Winston 
(人 工 智能 )。 尽 管 他 们 提供 帮助 的 程度 不 同 ， 但 是 他 们 所 作出 的 贡献 对 提高 最 终 忆 稿 的 质量 部 
是 有 重要 意义 的 。 我 深 感 荣耀 ， 并 致 以 感谢 。 基 于 这 点 ， 我 应 该 发 布 如 下 免责 声明 : 这 本 书 的 
最 终 内 容 和 教学 理念 不 一 定 反映 上 述 作者 的 观点 。 特 别 地 ， 我 对 书 中 《明显 的 和 隐 仿 的) 销 诈 
_ 和 观点 负 有 全 部 责任 。 


和 二 


mn 覃 ia ，- 吕 -re 下 到 有 地 3 1 =“ 有 只 加 业 
而 本 汪 呈 于 上 下 于 有- 下 ja 丰 -放下 下 Ae 二 HE -关于 | 和 9 全 二 和 和 aa 
Le as 


本 书 概念 由 具体 到 抽象 逐步 推进 一 一 这 是 一 种 很 利于 教学 的 顺序 ， 每 一 个 主题 自然 而 然 地 
引导 出 下 一 个 主题 。 本 书 首先 介绍 的 是 信息 编码 及 计算 机 体系 结构 的 基本 原理 (第 1 量 和 第 2 章 ) 
进而 是 操作 系统 《第 3 章 ) 和 组 网 及 因特网 〈 第 4 章 ) 的 学 习 ， 接 着 探讨 了 算法 、 程 序 设 计 语 言 
及 软件 工程 〈 第 5 章 至 第 7 章 )， 然 后 探索 数据 抽象 和 数据 库 〈 第 8 章 和 第 9 章 ) 方面 的 问题 ， 第 10 
章 讲述 计算 机 图 形 学 技术 的 一 些 重 要 应 用 ， 第 11 章 涉及 人 工 智 能 ， 第 12 章 通过 对 计算 理论 的 介 
绍 来 结束 全 书 。 

本 书 编排 顺序 自然 连贯 ， 但 各 个 章节 仍 保持 很 强 的 独立 性 ， 可 以 单独 但 阅 ， 也 可 以 根据 不 
同学 习 顺 序 重新 排列 。 事 实 上 ， 本 书 已 作为 各 类 课程 的 教材 ， 内 容 选 择 的 顺序 是 多 种 多 样 的 。 
其 中 一 种 教 法 是 先 介绍 第 5 章 和 第 6 章 〈 算 法 和 程序 设计 语言 )， 然 后 按照 需要 返回 到 前 面 章 六 。 
我 还 知道 有 人 是 从 第 12 章 有 关 可 计算 性 的 内 容 开 始 的 。 在 其 他 一 些 情况 中 ， 这 本 书 还 管 作为 这 
入 不 同 领域 项 目的 主干 ， 用 于 “高 级 研讨 班 ” 的 教科 书 。 对 于 不 需要 太 多 技术 的 读者 的 译 程 ， 
可 以 重点 讲述 第 4 章 〈 组 网 及 因特网 )、 第 9 章 〈 数 据 库 系统 )、 第 10 章 〈 计 算 机 图 形 学 ) 和 第 11 
章 《 人 工 智能 )。 

在 目录 中 ， 本 书 已 经 用 星 号 标识 出 了 选 学 章节 。 其 中 有 些 章节 讨论 更 专门 的 话题 ， 有 些 是 
对 传统 内 容 的 深入 探究 。 此 举 仅 仅 是 为 那些 想 采取 不 同 阅读 顺序 的 人 提供 建议 。 当 然 ， 还 有 其 
他 读 法 。 尤 其 对 于 那些 寻求 快速 阅读 的 读者 ， 我 建议 采取 下 面 的 阅读 顺 订 : 


章 刷 主 旺 
1.1 一 1.4 数据 编码 和 存储 基础 
2.1 一 2.3 计算 机 体系 结构 和 机 器 语言 
3.1 一 3.3 操作 系统 

4.1 一 4.3 组 网 及 因特网 

5.1 一 5.4 算法 和 算法 设计 

和 .1 一 6.4 程序 设计 语 育 

7.1 一 7.2 软件 工程 

8.1 一 8.2 数据 抽象 

9.1 一 9.2 数据 库 系 统 

10.1 一 10.2 计算 机 图 形 学 
11.1 一 11.3 人 工 智 能 

12.1 一 12.2 计算 理论 


在 本 书 中 有 几 条 贯穿 始终 的 主线 。 主 线 之 一 是 计算 机 科学 是 不 断 发 展 变化 的 。 本 书 从 历史 
发 展 的 角度 反复 呈现 各 个 主题 ， 讨 论 其 当前 的 状况 ， 并 指出 研究 方向 。 另 一 条 主线 是 抽象 的 作 
用 以 及 用 抽象 工具 控制 复杂 性 的 方式 。 该 主线 在 第 0 童 引入 ， 然 后 在 操作 系统 、 体 系 结构 、 算 法 
开发 、 程 序 设 计 语 言 、 软 件 工程 、 数 据 组 织 和 计算 机 图 形 学 等 内 容 中 反复 体现 。 


VI 前 言 





unFETTEZEip PIT 二 ET 有 加 可 ab | 


致 教师 


本 教材 万 包含 的 内 容 通常 不 可 能 在 一 个 学 期 内 讲授 完 ， 因 此 一 定 要 果断 地 略 掉 不 适合 教学 
备 要 的 那些 主题 ， 或 者 根据 需要 重新 调整 讲授 顺序 。 你 会 发 现 ,尽管 本 书 有 它 因 有 的 结构 体系 ， 
但 各 个 主题 在 很 大 程度 上 又 是 相对 独立 的 ， 可 以 根据 需要 做 出 选择 。 我 写本 书 的 目的 是 把 它 作 
为 一 种 课程 的 资源 ， 而 非 课程 的 定义 。 本 人 喜欢 把 某 些 主题 留 作 阅读 作业 ， 鼓 励 学 生 自己 学 习 ， 
而 个 在 诛 笃 讲 授 。 我 认为 ， 如 果 认为 所 有 的 东西 都 一 定 要 在 课堂 上 讲 ， 那 就 低估 学 生 的 能 力 了 。 
我 们 应 该 教会 他 们 独立 学 习 。 

关于 本 书 从 具体 到 抽象 的 组 织 结构 ， 我 觉得 有 必要 多 言 几 句 。 作 为 学 背 ， 我 们 总 以 为 学 
生 会 欣 黄 我 们 对 于 学 科 的 观点 ， 这 些 观点 是 我 们 在 某 一 领域 多 年 工作 中 形成 的 。 但 作为 老师 ， 
我 认为 我 们 最 好 从 学 生 的 视角 提供 教材 。 这 就 是 为 什么 本 书 首先 介绍 的 是 数据 的 表示 /存储 、 
计算 机 体系 结构 、 操 作 系统 以 及 组 网 ， 因 为 这 些 都 是 学 生 们 最 容易 产生 共鸣 的 主题 他 们 
很 可 能 听 说 过 JPEG、MP3 这 些 术语 ， 可 能 用 CD 和 DVD 刻录 过 资料 ， 买 过 计算 机 配件 ， 应 用 过 
东 一 操作 系统 ， 或 者 上 过 因特网 。 我 发 现 ， 从 这 些 主题 开始 讲授 这 门 课程 ， 我 的 学 生 找到 了 
许多 困惑 他 们 多 年 的 问题 的 答案 ， 而 且 开始 把 这 门 课 看 作 是 实践 课程 而 不 是 纯 理论 的 课程。 
由 此 出 发 就 会 很 自然 地 过 渡 到 较 抽象 的 内 容 上 ， 例 如 算法 、 算 法 结构 、 程 序 设计 语言 、 软 件 
开 久 方法 、 可 计算 性 以 及 复杂 性 等 。 而 这 些 内 容 就 是 我 们 这 些 从 事 该 领域 的 人 所 认为 的 计 委 
机 科学 的 主要 内 容 。 正 如 我 前 面 所 说 的 ， 并 不 是 强求 大 家 都 按 此 顺序 讲课 ， 只 是 我 鼓励 你 们 
如 此 和 莹 试 一 下 而 已 。 

我 们 都 知道 ， 学 生 能 学 到 的 东西 要 远 远 多 于 我 们 直接 传授 的 ， 而 且 潜 移 默 化 地 传授 要 更 容 
乌 吸 收 。 当 要 “传授 ”问题 的 解决 方法 时 ， 就 更 是 如 此 。 学 生 不 可 能 通过 学 习 问题 求解 的 方法 
而 变 成 问题 的 解决 者 。 他 们 只 有 通过 解决 问题 一 一 还 不 仅仅 是 那些 精心 设计 过 的 “教科 书 式 的 
问题， 才能 成 为 问题 的 解决 者 。 因 此 我 在 本 书 中 加 入 了 大 量 的 问题 ， 其 中 有 -- 些 问题 是 有 意 模 
梭 两 可 的 意味 痢 正 确 答案 不 只 一 个 。 我 建议 你 们 采用 并 充分 拓展 这 些 问 题 。 

我 要 放 在 “潜移默化 学 习 ” 这 一 类 主题 中 谈论 的 内 容 还 有 职业 道德 、 伦 理 和 社会 责任 感 。 
我 认为 这 种 内 容 不 可 能 独立 成 章 ， 而 是 应 该 在 有 所 涉及 时 讨论 ， 这 是 本 书 的 编排 方法 。 你 们 会 
发 现 ， 3.5 节 、4.5 节 、7.8 节 、9.7 节 和 11.7 节 分 别 在 操作 系统 、 组 网 、 软件 工程 、 数 据 库 系统 和 
人 工 智 能 的 上 下 文中 提 及 了 安全 、 隐 私 、 责 任 和 社会 意识 的 问题 。 而 且 ，0.6 节 就 通过 总 结 -一 些 
比较 着 名 的 理论 而 引入 这 一 主线 一 一 这 些 理论 都 企图 把 伦理 上 的 决断 建立 在 哲学 的 坚实 基础 
上 。 同 时 你 还 会 发 现 ， 每 一 章 都 包含 了 “社会 问题 ”小 节 ， 这 些 问题 将 鼓励 学 生 思 考 现实 社会 
与 教材 内 容 的 关系 。 

感谢 你 对 本 书 感 兴趣 。 无 论 你 是 否 选用 本 书 作为 教材 ， 我 都 希望 你 认同 它 是 -部 计算 机 科 
学 教育 文献 。 
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教学 特色 


本 书 是 多 年 教学 经 验 的 结晶 ， 因此 在 教学 辅助 方面 考虑 较 多 。 最 主要 的 是 提供 了 丰富 的 问 
题 以 加 强 学 生 的 参与 性 -一 本 版 包含 1000 多 个 问题 ， 分 为 “问题 与 练习 入 “复习 题 ” 和 “社会 
问题 . “问题 与 练习 ” 列 在 每 节 末 尾 《除了 第 0 章 外 )， 用 于 复习 刚刚 讨论 过 的 内 容 、 扩 充 以 前 
讨论 过 的 知识 ， 或 者 提示 以 后 会 涉及 的 有 关 主 题 。 这 些 问题 的 答案 可 以 从 图 灵 网 站 本 书 网 页 免 
费 注 册 下 载 (www.turingbook .comy， 
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一 


“复习 题 ” 列 在 每 章 的 末尾 (除了 第 0 章 没有 以 外 )。 它 们 是 课 后 作业 ， 内 容 履 盖 整 章 ， 在 书 


中 不 给 出 答案 。 
“社会 问题 ”也 列 在 每 章 的 末尾 ， 供 思考 讨论 。 许 多 问题 可 以 用 来 开展 课外 研究 ， 可 要 求学 
生 提 交 简 短 的 书面 或 口头 报告 。 


在 每 章 的 未 尾 还 设 有 “课外 阅读 ” 它 列 出 了 与 本 章 主题 有 关 的 参考 资料 。 同 时 ， 前 言 以 及 
正文 中 所 列 的 网 址 也 非常 适合 查找 相关 资料 。 


本 书 的 许多 补充 材料 可 以 从 配套 网 站 www.aw.ccom/brookshear 上 找到 。 以 下 内 容 面 癌 所 
有 读者 。 
_@ 每 章 的 活动 帮助 加 深 理解 本 教材 的 主题 ， 并 提供 机 会 了 解 其 他 相关 主题 。 
es 每 章 的 “ 自 测 题 ” 帮 助 读者 复习 本 书 中 的 内 容 。 
e 介绍 Java 和 C++ 基本 原理 的 手册 在 教学 顺序 上 与 本 书 是 一 致 的 。 
除 此 之 外 ， 教 师 还 可 以 登录 Addison-Wesley 的 教师 资源 中 心 (www.aw.com/ric) 或 图 有 
网 站 〈www.turingbook.com) 本 书 网 页 申请 获得 下 面 的 教 辅 微 料 。 
e 包含 “复习 题 ”答案 的 教师 指导 。 
es PowerIPoint 约 灯 片 讲稿。 
e 测试 题库 。 
你 也 许 还 想 看 一 下 我 的 个 人 网 站 www.mscs.mu.edu/~glennb， 不 是 很 正式 《体现 了 我 某 
一 时 的 灵感 和 幽默 )， 但 你 或 许 能 找到 些 有 用 的 信息 。 


和 二 二 
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致 学 生 


我 有 一 点 点 偏执 〈 一 些 朋 友 说 我 可 远 不 是 一 点 点 )， 所 以 写本 书 时 ， 我 经 常 不 接受 他 人 的 建 
议 , 其 中 许多 人 认为 一 些 内 容 对 于 初学 者 过 于 高 深 。 我 相信 即使 学 术 界 把 它们 归 为 “名 级 论题 ， 
但 只 要 与 主题 相关 就 是 合适 的 。 读 者 需要 的 是 一 本 全 面 介 绍 计算 机 科学 的 教科 书 ， 而 不 是 “ 缩 
了 水 ”的 版 本 一 一 只 包括 那些 被 简化 了 的 、 被 认为 是 适合 初学 者 的 主题 。 因 此 我 不 回避 任何 主 
题 ， 相 反 ， 我 还 力求 寻找 更 好 的 解释 。 我 力图 在 一 定 深 度 上 向 读者 展示 计算 机 科学 最 真实 的 一 _ 
面 。 就 好 比 对待 菜 谱 里 的 那些 调味 品 一 样 ， 你 可 以 有 选择 地 略 过 本 书 的 一 些 主题 ， 但 我 与 这 些 
主题 是 为 了 在 你 想 要 的 时 候 供 你 “ 品 答 ”， 而 且 我 也 或 励 你 们 去 笠 试 。 

我 还 要 指出 的 是 ， 在 任何 与 技术 有 关 的 课程 中 ， 目 前 学 到 的 细节 可 能 不 适合 以 后 的 需要 。 这 
个 领域 是 发 展 变化 的 一 一 这 正 是 使 人 兴奋 的 方面 。 本 书 将 从 现实 及 历史 的 角度 展现 本 学 科 内 容 。 
有 了 这 些 背 景 知识 ， 你 们 就 会 和 技术 一 起 成 长 。 我 希望 你 们 现在 就 开始 行动 起 来 ， 不 局 限于 诛 本 
的 内 容 进行 探索 。 要 学 会 学 习 。 

感谢 你 们 对 我 的 信任 ， 选 择 了 我 的 这 本 书 。 作 为 作者 ， 我 有 责任 创作 出 值得 一 读 的 作品 。 
我 希望 你 们 看 到 我 已 经 尽 到 了 这 份 责任 。 


致谢 


首先 我 要 感谢 那些 支持 本 书 〈 阅 读 并 使 用 本 书 前 几 个 版 本 ) 的 人 们 ， 我 感到 很 荣幸 。 


工人 
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随 着 每 一 次 新 版 本 的 问世 ， 给 本 书 提出 建议 的 审 稿 人 和 顾问 也 越 来 越 多 。 我 在 前 面 已 经 提 
到 过 ， 要 特别 感谢 Ed Angel、John Carpinelli、Chris Fox、Jim Kurose、 (TaIV NUIT、Greg Riccardi 
和 Patrick Henry Winston 在 第 10 版 中 所 做 的 贡献 。 同 时 要 感谢 Michael Hirsch， 他 是 本 书 的 编辑 ， 
也 是 我 的 朋友 ， 正 是 他 说 服 了 这 些 作者 ， 让 他 们 愿意 腾 出 宝贵 的 时 间 。 

如 今 ， 其 他 对 第 10 版 做 出 贡献 的 人 包括 J. M.Adams、CM.Allen、D.C.S.Allison、R_Ashmaore、 
B.Auermhelmer、 了 上 Bankston、M.Barnard.PBender.K.Bowyer.PW.BrashearC.M.Brown、B.Calloni、 
MLjancy、R.IClose、D.H.Cooley、L.D.Comell、M.J.Crowley、F.Deek、M_LDickerson 、M] .Duncan、 
.上 ox、N.E.Gibbs、J.D.Harris、D.Hascom、L.Heath、PB.Henderson、L .Hunt、 M.Hutchenreuther、 
上 .A.Jehn、 玉 .KR.Kolberg、 玫 .Korb、GKrenz、JLiu、 JJLong、C.May、W.McCown、S.JMerrill、 
k.Messersmith、J.C.Moyer、M.Murmhy、J.PMyers、Jr ，D.S.Noonan、S.Olariu、 (Rice、N.Rickert、 
L.Riedesel]、J.B.Rogers、(GSaito、W.Savitch、 R.schlafly、J.C.Schlimmer、S.Sells、G.Sheppard、 
2.5hen、J (LSimms、M.C.Slattery、JSlimick、J.A.Slomka、D.Smith、J.Solderitsch 、 及 .Steligerwald、 
L.steinberg、C-A.Struble、C.L.Stmble、W.J.Taffe、J.Talburt、PTonellato、PTromovitch、 E.D.Winter、 
E.Wright、M.Ziegler， 还 有 一 位 匿名 的 朋友 。 我 向 他 们 中 的 每 一 位 致 以 我 最 真诚 的 谢意 。 

尤其 要 感谢 威斯康星 大 学 斯 道 特 分 校 的 Diane Christie， 她 认真 地 重 写 了 Java 和 C++ 手 肌 ， 这 
兰 手册 可 从 前 面 “补充 材料 ”中 提 到 的 Addison-Wesley 网 站 下 载 。 还 要 感谢 Roger Eastman， 他 
更 新 了 本 书 网 站 上 提供 的 辅助 资料 ， 我 非常 感激 他 为 此 所 做 的 努力 。 

找 同 时 要 感谢 为 本 项 目 做 出 贡献 的 Addison-Wesley 的 员工 。 他 们 不 仅 是 很 好 的 合作 伙伴 ， 
和 而且 还 是 很 好 的 朋友 。 如 果 你 们 打算 写 一 本 教材 ， 可 以 考虑 交 给 Addison-Wesley 出 版 。 

我 还 要 感谢 我 的 夫人 Earlene 和 我 的 女儿 Cheryl， 感 谢 她 们 这 人 么 多 年 对 我 的 鼓励 。 当然 Cheryl 
己 经 长 大 ， 几 年 以 前 已 经 离 家 开始 独自 生活 。Earlene 还 陪 在 我 身边 。 我 是 一 个 幸运 的 人 。1998 
年 12 月 11 日 的 早晨 ， 我 突 发 心脏 病 ， 是 她 及 时 把 我 送 到 了 医院 ， 让 我 逃 过 了 一 动 。 (对 于 年 轻 一 
代 的 你 们 ， 我 有 必要 解释 一 下 ， 躲 过 心脏 病 的 一 过 有 点 像 你 们 又 获准 延期 提交 课 后 作业 。) 

最 后 ， 我 要 感谢 我 的 父母 ， 本 书 即 是 给 他 们 的 献礼 。 我 用 下 面 一 名 赞美 的 话 作为 结束 ， 就 
不 说 是 他 们 哪 一 个 说 的 了 :“ 我 们 儿子 的 书 真 的 非常 好 ， 人 人 都 应 该 阅读 .” 


J.GB 
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苯 赦 的 老师 : 

您 好 ! 

为 了 确保 您 及 时 有 效 地 申请 教 辅 资 源 ， 请 您 务必 完整 填写 如 下 教 辅 申请 表 ， 加 盖 学 院 的 
公章 后 传真 给 我 们 ， 我 们 将 会 为 您 开通 属于 您 个 人 的 唯一 帐号 以 供 您 下 载 与 教材 配套 的 教师 资源 。 


请 填写 所 需 教 辅 的 开课 信息 : 


口 本 科 1/2 年 级 
口 本 科 3/4 年 级 
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在 否 怪 意 接受 我 们 定期 的 新 书 讯 且 通 知 : 口 是 口 否 
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绪 论 


2 
的 学 习 。 

计算 机 科学 是 这 样 一 门 学 科 ， 它 寻求 为 计算 机 设计 、 计 算 机 程序 设计 、 信 息 处 理 、 问 题 的 
算法 解 和 算法 过 程 本 身 等 主题 建立 科学 的 基础 。 计 算 机 科学 既是 当今 计算 机 应 用 的 支柱 ， 又 是 
今后 应 用 的 基础 。 

本 书 将 详细 介绍 计算 机 科学 ， 探索 广阔 的 主题 ， 包 括 那 些 构成 一 般 大 学 计算 机 科学 课程 的 
主题 。 我 们 要 领略 这 个 领域 的 博大 精深 和 变化 发 展 。 因 此 ， 除 了 这 些 主题 本 身 ， 我 们 还 关注 于 
它们 的 历史 发展 、 现 今 的 研究 动态 以 及 今后 的 前 景 。 我 们 的 目标 是 让 人 们 以 学 以 致 用 的 态度 来 
对 符 计 算 机 科学 一 一 既 帮 助 那些 要 在 此 领域 继续 深入 学 习 的 人 ， 也 促成 其 他 领域 的 人 在 技术 不 
断 进 步 的 社会 狐 露 头角 。 


本 两 二 尾村 二 利息 村 秆 生生 下 下 让 攻 生生 的 ED 寺 Er 全 人 和 入 计 放生 着 本 二 于 村 有 本 和 古 丰 下 大 1 下 三 全 三 引 后 后 于 -生生 作 


0.1 算法 的 作用 _ 


首先 让 我 们 了 解 一 下 计算 机 科学 最 基础 的 概念 一 “算法 ” 一 般 来 讲 ， 算 法 (algorithm ) 
是 一 系列 的 步骤 , 它 规定 如 何 完成 一 项 任务 。( 在 第 5$ 章 中 , 我 们 将 给 出 比较 精确 的 定义 。) 例如 ， 
有 关于 烹饪 的 算法 〈 称 为 菜谱 y》)， 有 在 陌生 城市 准确 定位 的 算法 〈 通 常 称 为 道路 指南 )， 有 使 用 
洗衣 机 的 算法 〈 通 常 标示 在 洗衣 机 的 内 盖 上 或 者 是 贴 在 自助 洗衣 机 店 的 墙 上 )， 有 演奏 音乐 的 算 
法 《以 乐谱 的 形式 表示 )， 还 有 魔术 表演 的 算法 〈 见 图 0-1)。 


效果 : 表 涡 者 从 一 副 普通 的 扑克 牌 中 抽取 若干 张 牌 ， 充 分 洗 牌 后 将 牌 正面 朝 下 展开 在 桌面 上 。 然 后 ， 表 演 者 会 
根据 观 矢 的 要 求 ， 相 应 地 翻 出 红牌 或 者 黑 牌 。 


秘诀 : 

步骤 1 从 一 副 普通 扑克 租 中 抽取 10 张 红牌 和 10 张 黑 牌 。 把 它们 根据 颜 色 分 为 两 操 ， 正 面 彰 上 放 在 桌面 上 ， 

步 邓 2 告诉 观众 你 已 经 选取 了 考 干 张 红 牌 和 黑 牌 。 

步骤 3 语 起 红牌 ， 装 作 整 理 成 一 摆 的 样子 ， 用 左手 正面 朝 下 拿 好 牌 ， 同 时 用 右手 的 拇指 和 食指 挤 压 这 摆 牌 的 
两 端 ， 把 牌 面向 下 推 ， 人 司 得 每 张 牌 呈 现 向 下 的 弧 形 。 然 后 ， 继 续 把 这 摆 红 牌 扣 在 捍 子 上 ， 并 宣布 , “这 
是 其 中 的 红牌 。” 

步 野 4 拿 起 黑 牌 ， 模 仿 步 枝 3 的 方法 ， 使 这 些 牌 呈现 向 上 的 新 形 。 然 后 ， 变 续 把 牌 扣 在 桌子 上 上， 宣布 , “这 是 
其 中 的 黑 牌 。” 

步骤 5 把 需 牌 放 回 桌面 后 ， 立 即 用 双手 把 红牌 和 黑 牌 混在 一 起 〈 仍 然 正面 朝 下 )， 展 开 在 捍 面 上 。 说 明 你 已 经 
洗 好 了 牌 。 

步 村 6 只 要 和 昌 面 上 还 有 扣 着 的 牌 ， 可 以 重复 下 面 的 步骤 ， 
6.1 请 观众 要 一 张 红 牌 或 黑 牌 。 
6.2 如 果 所 要 的 牌 为 红色 ， 而 且 桌 面 上 倒 扣 有 止 形 的 牌 ， 就 翻 开 其 中 的 一 张 ， 说 “这 是 一 张 红 牌 ”。 
6.3 如 果 所 要 的 牌 为 黑色 ， 而 且 卓 面 上 倒 扣 有 凸 形 的 牌 ， 就 翻 开 其 中 的 一 张 ， 说 “这 是 一 张 申 牌 所 
6.4 否则 说 ， 课 面 上 没有 所 要 求 颜色 的 牌 了 ， 然 后 翻 开 卓 面 上 所 有 的 牌 ， 以 证 实 你 的 断言 。 


图 01 一 个 魔术 的 算法 
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在 一 台 机 器 《〈 如 计算 机 ) 执行 一 项 任务 之 前 ， 必 须 先 找到 完成 这 项 任务 的 算法 ， 并 且 用 与 
该 机 器 兼容 的 形式 表示 出 来 。 某 一 个 算法 的 表示 称 作 一 个 程序 (program)。 为 了 人 们 读 写 方便 ， 
此 算 机 程序 通常 打印 在 纸 上 或 者 显示 在 计算 机 屏幕 上 。 为 了 便于 机 器 识别 ， 程 序 需 要 采取 一 种 
与 该 机 咒 技 术 鳞 容 的 形式 进行 编码 。 开 发 一 个 程序 ， 使 之 采取 与 机 器 兼容 的 形式 进行 编码 并 将 
乓 输入 到 机 器 中 的 过 程 ， 称 作 程序 设计 〈programming)。 程 序 及 其 所 表示 的 算法 阁 称 为 软件 
(sottware)， 而 机 器 设备 本 身 称 为 硬件 (hardware)。 

合法 的 研究 起 源 于 数学 学 科 。 事 实 也 的 确 如 此 ， 它 是 数学 家 的 重要 活动 ， 这 要 远 远 早 于 当 
今 计算 机 的 开发 。 它 的 目标 是 找 出 一 组 指令 ， 描 述 如 何 解决 某 一 特定 类 型 的 所 有 问题 。 求 解 两 
个 多 位 数 商 的 长 除 算法 是 早期 研究 中 一 个 最 著名 的 例子 。 另 一 个 例子 是 十 希腊 数学 家 欧 几 里 得 
余 现 的 欧 几 里 得 算法 一 一 求 两 个 正 整数 的 最 大 公约 数 的 【 见 图 0-2)， 


描述 ， 本 算法 假定 它 输入 的 是 两 个 正 整 数 ， 目 的 是 要 计算 这 两 个 数 的 最 大 公约 数 。 


过 程 : 

步 昧 1 分 别 赋予 M 和 AN 这 两 个 数 中 较 大 的 - -个 和 较 小 的 一 个 的 值 。 

步骤 2 用 M 除 以 W， 余 数 设 为 R。 

步骤 3 ”如果 R 不 为 0， 那 么 将 N 的 值 赋予 M， 并 将 R 的 值 荆 予 N， 然后 回 到 步骤 2， 理 则 最 大 公约 数 就 是 N 当 前 被 
赋予 的 值 。 








图 0.2 求 两 个 正 整数 的 最 大 公约 数 的 欧 几 里 得 算法 


一 二 我 们 找到 了 执行 一 个 任务 的 算法 ， 那 么 在 执行 该 任务 时 ， 就 不 再 需要 了 解 该 算法 所 依 
提 的 原理 。 任 务 的 完成 演变 成 遵照 指令 操作 的 过 程 。( 不 需要 了 解 算 法 的 工作 原理 ， 我 们 就 可 以 
很 据 长 除 算法 求 商 ， 或 者 根据 欧 几 里 得 算法 求 得 最 大 公约 数 。) 在 某 种 意义 上 ， 解 决 这 个 问题 的 
智能 被 编码 到 算法 中 。 

我 们 能 够 设计 出 那些 执行 有 用 任务 的 机 器 是 因为 我 们 有 上 述 能 力 通过 算法 来 捕获 和 传达 知 
能 《至 少 是 智能 行为 )。 因 此 ， 机 器 的 智能 级 别 受 限 于 算法 所 传达 的 智能 。 只 有 存在 执行 某 一 项 
任务 的 复 法 时 ， 我 们 才 可 以 制造 出 执行 这 一 任务 的 机 器 ， 换 言 之 ， 如 果 我 们 找 不 到 一 个 解决 基 
问题 的 算法 ， 那 么 这 个 问题 的 解决 就 超过 了 机 器 的 能 力 。 

20 蕊 纪 30 年 代 ， 库 尔 特 ， 哥 德尔 (Kurt Gtdel) 发 表 了 不 完备 性 定理 的 论文 ， 它 使 确定 算法 
月 力 的 局 限 性 成 为 数学 的 一 个 研究 课题 。 这 个 定理 的 主旨 就 是 ， 在 任何 一 个 包括 传统 意义 的 贡 
丰 系 统 的 数学 理论 内 ， 总 有 一 些 命题 的 真 伪 是 无 法 通过 算法 的 手段 来 确定 的 。 简 吉之 ， 对 于 作 
何 算术 系统 的 全 面 研究 都 超越 了 算法 活动 的 能 力 。 

这 一 认识 动 播 了 数学 的 基础 ， 于 是 关于 算法 能 力 的 研究 随 之 而 来 ， 它 开创 了 今天 计算 机 科 
学 这 门 学 科 。 的 确 ， 正 是 算法 的 研究 构成 了 计算 机 科学 的 核心 。 
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信人 的 计算 机 有 着 庞大 久远 的 世系 渊源 。 其 中 较 早 的 计算 设备 之 -是 算盘 。 算 盘 本 身 非 党 
珊 汗 ， 一 个 矩形 框 里 固定 着 一 组 小 棍 ， 而 每 个 小 棍 上 又 各 串 有 -组 珠子 〈 见 图 0.3)。 在 小 很 上 ， 
闪 了 上 上 下 移动 的 位 置 就 表示 所 存储 的 值 。 正 是 这 些 珠子 的 位 置 表示 了 这 人 台 “计算 机 ”所 代表 和 和 
存储 的 数据 。 这 人 台 机 器 是 依靠 人 的 操作 来 控制 算法 执行 的 。 因 此 ， 算 盘 自 身 只 算得 上 -一个 数据 
存储 系统 ， 它 必须 在 人 的 配合 下 才 成 为 一 台 完 整 的 计算 机 跟 ， 
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图 0-3 ”算盘 〈Wayne Chandler 拍 摄 ) 


后 来 ， 计 算 机 器 的 设计 是 基于 齿轮 技术 的 。 采 用 这 种 技术 的 发 明 家 有 法 国 的 布 菜 斯 . 由 其 
卡尔 〈Blaise Pascal，1623 一 1662 》、 德国 的 戈 特 弗 里 德 ， 威 尔 赫 尔 姆 : 菜 布 尼 欧 《Gottfried 
WwWihelm Leibniz，1646 一 1716) 和 英国 的 查尔斯 . 巴 贝 奇 〈《Charles Babbage，1792 一 1871) 等 。 
芝 绎 机 器 利用 齿轮 的 位 置 来 表示 数据 ， 要 在 规定 齿轮 初始 位 置 的 基础 上 机 械 地 输入 数据 。 忻 扫 
下 尔 和 莱 布 尼 蒋 的 机 器 结果 是 从 观察 齿轮 的 最 终 位 置 得 到 的 。 另 一 方面 ， 巴 贝 奇 设想 有 这 样 
种 机 器 ， 可 以 把 计算 的 结果 打印 在 纸 上 ， 以 便 消 除 可 能 出 现 的 普 写 错 误 。 

哮 拟 行 算法 的 能 力 而 言 ， 我 们 可 以 看 到 这 些 机 器 在 灵活 性 上 的 进步 。 帕 斯 卡尔 的 机 器 只 是 
为 了 执行 加 法 。 因 此 ， 必 须 在 机 器 结构 本 身 嵌 入 用 到 的 步骤 序列 。 同 样 ， 汪 布 尼 蒋 的 机 器 岂 把 
它 的 算法 嵌入 在 其 体系 结构 中 ， 尽 管 它 提 供 了 多 种 算术 运算 供 操作 员 选 择 。 巴 贝 奇 的 差分 机 仅 
造 了 一 个 演示 模型 ， 可 以 修改 以 执行 各 种 计算 ， 但 他 设计 的 分 析 机 〔〈 该 机 的 制造 没有 得 到 任何 
法 金 的 支持 ) 则 能 够 在 纸 卡片 上 读 取 以 洞 孔 形式 表示 的 指令 。 所 以 ， 巴 贝 奇 的 分 析 机 是 可 编程 
的 。 事实 上 ， 奥 古 斯 塔 ” 艾 达 ， 拜 伦 (Augusta Ada Byron) 通常 被 称 为 世界 上 第 一 个 程序 员 ， 
她 曾 发 表 过 一 篇 论文 ， 阑 述 巴 贝 奇 的 分 析 机 如 何 编程 并 实现 各 种 各 样 的 计算 问题. 


熏 记 斯 塔 艾 达 ， 拜 伦 


自从 关 国 国防 部 以 她 的 名 字 命名 一 个 程序 设计 语言 以 来 ， 洛 夫 菜 斯 伯 蔬 夫人 奥 十 斯 
溶 “ 艾 达 拜 伦 成 了 计算 界 关注 的 仿 点 人 物 。 艾 达 ， 拜 伦 的 一 生 近 平 砷 惨 ， 去 世 时 还 不 到 
37 多 (1815 一 1852 )， 地 体弱多病 ， 身 处 限制 妇女 从 业 的 社会 ， 还 是 个 新 教 教徒 ， 尽 管 对 广 
泛 的 科学 愿 兴趣 ， 但 她 还 是 专注 于 数学 研究 1833 年 ， 目 睹 了 查尔斯 ， 巴 贝 村 的 差分 机 样机 
演示 后 ， 她 就 被 这 台 机 器 迷 住 了 。 地 对 计算 机 科学 的 贡献 是 ， 好 把 二 篇 讨论 蔬 贝 奇 分 析 栅 没 
计 的 论文 从 法 文 翻译 为 英文 。 巴 贝 奇 还 鼓励 她 在 翻译 中 增加 一 个 附录 ， 介 绍 该 机 路 的 应 用 、 
站 提供 了 例子 说 明 该 机 器 如 何 进行 编程 以 实现 各 种 各 样 的 任务 。 巴 贝 奇 对 艾 达 ， 兰 和 伦 的 工 
作 十 分 热情 ， 这 是 因 为 他 希望 论文 的 出 版 可 以 帮助 他 得 到 资金 接 助 ， 以 建造 他 的 分 析 机 .( 作 
为 拜 伦 矶 芋 的 女儿 ， 艾 达 . 拜 伦 具 有 名 人 的 地 位 ， 在 生意 场 上 也 有 潜在 的 关系 ,站 巴 贝 柯 最 终 
也 没有 得 到 资金 援助 ， 但 是 藉 达 . 羡 伦 的 附录 保存 了 下 来 ， 人 人 们 认为 该 附录 包含 了 第 一 批 计 
了 机 程序 的 例子 。 所 以 ， 奥 二 斯 塔 ， 艾 达 ， 拜 伦 被 认为 是 世界 上 第 一 个 程序 员 ， 关 于 区 册 喜 
四 们 这 工作 的 影响 程度 ， 研 究 计算 机 历史 的 学 者 们 一 直 争 论 不 体 ， 有 些 历史 学 家 庆 为 巴 贝 洁 
全 直 了 重大 页 献 ; 另外 一 些 人 则 认为 巴 贝 奇 并 没有 帮 到 藉 达 ， 从 很 大 程序 上 来 看 反而 是 岂 种 
个 管 如 此 ， 奥 二 斯 塔 ， 艾 达 ， 拜 伦 被 认可 为 当今 世界 上 第 一 位 计算 机 程序 员 ， 美国 国 
防 部 为 了 纪念 这 位 伟大 的 女性 ， 用 她 的 名 字 命名 了 一 种 程序 设计 语言 (Ada 
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通过 纸 卡 片上 的 洞 孔 来 传达 算法 的 思想 并 不 是 源 于 巴 贝 奇 。 他 是 从 约 琶 夫 . 雅 卡尔 (Joseph 
Jacquard，1752 一 1834) 那儿 得 到 这 个 想法 的 。 约 瑟 夫 ' 雅 卡 尔 于 1801 年 研制 出 一 种 织 布 机 ， 它 
在 织 布 过 程 中 所 执行 的 步骤 是 由 纸 卡 片上 洞 孔 的 样式 决定 的 。 因 此 ， 织 布 机 的 算法 很 容易 进行 
修改 ， 可 以 制作 出 不 同 的 编织 设计 。 另 一 个 受益 雅 卡尔 思想 的 人 是 赫 尔 曼 : 起 尔 瑞 斯 (Herman 
Ho enth，1860 一 1929)， 他 肌 活 运用 这 一 观念 一 一 用 纸 卡 片上 洞 孔 的 样式 来 表示 信息 ， 加 速 了 
美国 1890 年 人 口 普查 中 的 表格 处 理 。( 霍 尔 瑞 斯 的 这 项 改造 导致 了 IBM 的 诞生 。) 这 种 卡片 最 终 
似 看 作 是 穿孔 卡片 ， 并 且 直 到 20 世 纪 70 年 代 ， 仍 作 为 一 种 流行 的 与 计算 机 交互 的 工具 。 的 确 ， 
这 项 技术 至 今 尚 存 ， 美 国 在 2000 年 总 统 选举 的 投票 工作 中 我 们 还 可 见 到 它 的 身影 。 

在 那个 年 代 ， 即 使 有 资金 的 支持 ， 技 术 上 也 不 足以 制造 帕斯卡 尔 、 莱 布 尼 蒋 和 巴 贝 奇 的 复 
杂 的 齿轮 驱动 的 机 器 。 但 是 ， 随 着 20 世 纪 初 期 电子 技术 的 进步 ， 人 们 殉 服 了 这 个 障碍 。 这 个 进 
步 的 例证 有 : 乔治 : 斯 蒂 比 兹 〈George Stibitz) 的 电子 机 械 机 器 ， 于 1940 年 在 贝尔 实验 室 里 建 
进 ; 马克 一 号 (Mark I)， 由 霍华德 ， 艾 肯 〈Howard Aiken) 和 IBM 公 司 的 一 个 工程 师 小 组 一 起 
在 哈佛 大 学 建造 〈 见 图 0-4)。 这 些 机 器 使 用 了 大 量 电子 控制 的 机 械 式 继电器 。 从 这 个 意义 上 说 ， 
这 些 机 器 几乎 是 刚 造 出 来 就 过 时 了 ， 因 为 其 他 研究 人 员 已 在 应 用 电子 管 技 术 建造 完全 电子 化 的 
计算 机 。 第 一 台 这 样 的 机 器 显然 是 Atanasoff-Berry 机 器 ， 1937 一 1941 年 由 约翰 : 阿 塔 纳 索 夫 
(John Atanasoff) 和 他 的 助手 克利 福 德 . 贝 利 《Clifford Berry) 建造 于 艾 奥 瓦 州立 学 院 〈 现 在 的 
艾 奥 瓦 州立 大 学 )。 另 一 台 是 称 为 巨人 《〈Colossus) 的 机 器 ， 在 汤 米 . 弗 劳 尔 (Tommy Flowers ) 
的 指导 下 建造 于 英国 。 该 机 器 在 第 二 次 世界 大 战 后 期 曾 用 来 破解 德国 的 情报 。 《实际 上 ， 这 类 机 
器 有 十 余 台 ， 但 是 由 于 军 方 的 保密 和 国家 安全 问题 ， 而 未 能 列 入 “计算 机 家 谱 ”) 不 久 ， 更 为 
灵活 的 机 器 出 现 了 ， 如 ENIAC 〈electronic numerical integrator and calculator， 电 子 数 字 积 分 器 和 
计算 器 )， 它 是 由 约翰 莫 奇 利 John Mauchly) 和 普 雷 斯 波 . 埃 声 特 本 Presper Eckert) 在 宾 
夕 法 尼 亚 大 学 莫 尔 电子 工程 学 院 研制 的 。 


属 0 
二 





图 0-4 “马克 一 号 计算 机 〈 照 片 由 Addison-Wesley 友 情 提 供 》 

从 那 时 起 ， 计 算 机 器 的 发 展 史 就 已 经 和 技术 进步 紧 紧 相连 ， 包括 草 体 管 的 发 明和 后 来 集成 
电路 的 开发 、 通 信 卫 星 的 使 用 以 及 光 技 术 的 进步 。 今 天 ， 便携 式 计 算 机 所 拥有 的 计算 能 力 比 20 
世纪 40 年 代 房 间 大 小 的 机 器 更 强大 ， 而 且 通 过 全 球 通信 系统 可 以 快速 地 彼此 交换 信息 。 

普及 计算 机 的 一 个 主要 步骤 就 是 开发 出 台式 机 。 这 些小 型 计算 机 的 起 源 可 以 追溯 到 20 世 纪 
40 年 代 ， 在 那些 大 型 科研 用 计算 机 开发 后 不 失 ， 计算 机 爱好 者 就 开始 了 家 用 计算 机 的 实验 。 正 
是 在 这 些 计 算 机 爱好 者 的 “地 下 ”活动 中 ， 史 蒂 夫 . 乔布斯 〔Steve Jobs) 和 斯 蒂 芬 . 沃 兹 尼 亚 
殉 《Stephen Wozniak) 两 个 人 制造 出 了 有 商业 价值 的 家 用 计算 机 ， 并 于 1976 年 成 立 了 蓉 果 计算 
机 会 司 《 现 称 苹果 公司 )， 制 造 和 销售 他 们 的 产品 。 其 他 经 销 类 似 产 品 的 公司 有 Commodore、 
Heathkit 和 Radio Shack 等 。 虽 然 这 些 产品 在 计算 机 爱好 者 中 很 畅销 , 但 是 并 没有 被 商业 界 普 遍 接 
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受 。 面 对 大 量 的 计算 需要 ， 这 些 商 家 仍然 青睐 于 著名 的 IBM 公 司 。 


臣 员 奇 的 差分 机 

登 永 斯 ， 巴 贝 奇 设计 的 这 人 台 机 器 的 确 是 现代 计算 机 设计 的 先驱 。 如 果 能 用 经 济 上 可 行 的 
技术 制造 出 这 台 机 器 ， 如 果 当 时 商业 和 政府 数据 处 理 需 求 达到 今天 的 规模 ， 那 么 巴 贝 奇 的 思 
想 可 能 在 19 世 纪 就 引发 了 计算 机 革命 。 事 实 上 ， 在 他 有 生 之 年 ， 只 是 造 出 了 差分 机 的 演示 模 
于 。 该 机 兰 通 过 “逐次 差分 ”的 计算 来 决定 数字 值 。 我 们 来 研究 一 下 计算 整数 平方 的 问题 ， 
这 会 有 助 于 我 们 加 深 对 这 一 技术 的 理解 . 首先 我 们 从 基础 知识 开始 ,0 的 平方 是 0，1 的 平方 是 
1，2 的 平方 是 4，3 的 平方 是 9。 据 此 ， 可 以 按照 下 面 的 方法 得 到 4 的 平方 ( 见 下 图 )。 首 先 我 
们 来 计算 一 下 已 知 平方 之 间 的 差 : 12- 02= 1，22-12=3，32-22= 3。 然后， 我 们 计算 这 些 外 
采 的 差 : 3 -= 2，5 -3=2。 注 意 看 ， 这 些 差 都 是 2。 假 设 这 个 规律 能 够 成 立 (数学 上 可 以 
证 明 它 是 成 立 的 ) 那么 我 们 可 以 得 出 这 样 的 结论 : (和 -32) 和 (32-22) 之 间 的 差 也 -一定 是 
2 由 于 【4 -3) 比 (条 -2) 大 2， 所 以 采 -32=7，4 笃 =3247= 16. 现在 ， 我 们 已 经 知道 了 4 
的 平方 ， 那 么 就 可 以 依据 |、2 、3 和 42? 的 值 悉 续 计算 5 的 平方 .( 虽然 更 深入 地 讨论 逐次 差分 
已 经 超出 了 我 们 的 学 习 范 围 ， 但 是 学 过 微 积 分 的 学 生 可 能 已 观察 到 ， 前 面 的 例子 是 基于 人 这样 


的 事实 : = 六 的 二 阶 导数 是 一 条 直线 . ) 





1981 年 ，IBM 公 司 推出 了 它 的 第 一 台 台 式 计算 机 ， 称 为 个 人 计算 机 或 PC， 其 基础 软件 由 一 
个 称 为 微软 《Microsoft) 的 年 轻 公 司 开发 。PC 立 即 获得 了 极 大 的 成 功 ， 并 且 黄 定 了 这 种 台式 计 
描 机 在 商界 人 士 心目 中 作为 日 用 品 的 地 位 。 今 天 ， 术 语 PC 已 广泛 地 指称 很 多 机 器 《〈 来 自 各 种 厂 
商 )， 其 设计 都 是 从 IBM 公 司 的 台式 计算 机 演变 而 来 ， 而 且 它们 大 多 数 继续 与 微软 公司 的 软件 一 
起 销售 。 不 过 ， 有 时 候 ， 术 语 PC 也 与 统称 的 术语 台式 机 和 笔记 本 电脑 互 换 使 用 。 

计 得 机 的 小 型 化 和 其 功能 的 日 益 增 多 已 经 把 计算 机 技术 推 向 了 当今 社会 的 最 前 沿 。 如 今 ， 
计 复 机 技术 非常 普及 ， 熟 练 掌握 其 应 用 已 经 成 为 现代 社会 成 员 的 基本 要 求 。 娱 乐 和 通信 系统 也 
己 经 开始 和 家 用 计算 机 紧密 相连 。 如 今 ， 利 用 计算 机 技术 ， 通 过 一 种 称 为 PDA 〈 学 上 个 人 数字 
助理 ) 的 设备 人 们 就 可 以 把 手机 、 数 码 相机 等 组 合 在 一 起 ，PDA 是 通过 无 线 广播 技术 进行 通信 
的 。 计 算 机 技术 已 经 改变 了 政府 施加 控制 的 能 力 ， 对 全 球 化 经 济 产生 了 巨大 的 影响 ， 导 致 在 科 
兰 研究 领域 出 现 了 一 些 令 人 瞩目 的 成 就 ， 革 新 了 数据 收集 、 存 储 和 应 用 的 作用 ， 不 停 地 挑战 社 
会 状态 问题 。 结 果 古 围绕 着 计算 机 科学 的 学 科大 量 涌现 ,每 门 学 科 现 在 都 成 了 重要 的 研究 领域 
而 县 ， 通 贡 很 难 在 机 械 工 程 和 物理 这 些 领域 与 计算 机 科学 之 间 画 出 一 条 分 界线 。 因 此 ， 为 了 获 
得 合适 的 视角 ， 我 们 的 研究 不 仅 覆 盖 了 计算 机 科学 核心 的 中 心 主题 ， 而 且 还 将 探索 处 理应 用 和 
科学 成 果 的 各 种 学 科 领 域 。 因 此 ， 对 计算 机 科学 的 全 面 介绍 必然 要 涉及 很 多 其 他 学 科 的 知识 . 
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天 让 而 和 一 本 


数据 存储 容量 有 限 ， 程 序 设 计 过 程 复杂 而 耗 时 ， 诸 如 此 类 原因 限制 了 早期 计算 机 器 所 能 处 
理 的 算法 复杂 性 。 然 而 ， 随 着 这 些 局 限 性 的 消除 ， 机 器 已 经 应 用 到 执行 越 来 越 艰巨 、 越 来 越 复 
架 的 任务 中 。 人 们 企图 用 算法 表达 这 些 任 务 的 构成 ， 但 却 感 到 了 思维 能 力 上 的 不 足 ， 于 是 越 来 
越 多 的 工作 转向 算法 和 程序 设计 过 程 的 研究 。 

在 这 种 情况 下 ， 数 学 家 的 理论 研究 开始 有 了 回报 。 由 于 哥 德 尔 不 完备 性 定理 ， 数 学 冢 已 经 
在 研究 有 关 算 法 过 程 的 问题 了 ， 而 这 正 是 先进 技术 目前 面临 的 问题 。 由 此 ， 了 孕育 出 了 被 称 作 计 
算 机 科学 的 这 门 学 科 。 

如 今 ， 计 算 机 科学 已 经 葛 定 了 它 算 法 科学 的 地 位 。 这 门 科学 范围 很 广 ， 涉 及 数学 、 工 程 学 、 心 
理学 、 生 物 学 、 商 业 管 理 和 语言 学 等 多 个 学 科 。 事 实 上， 研究 计算 机 科学 不 同 分 支 的 研究 人 员 对 
科学 的 定义 也 许 会 截然 不 同 。 例 如 ,计算 机 体系 结构 领域 中 的 研究 者 主要 关注 于 微型 电路 技术 ， 
因此 他 们 将 计算 机 科学 视 为 技术 的 进步 和 应 用 ;但 数据 库 系统 领域 的 研究 者 则 把 计算 机 科学 看 
成 是 寻求 方法 来 提升 信息 系统 的 有 用 性 ;而 人 工 智 能 领域 的 研究 者 则 把 计算 机 科学 视 为 智能 和 
智能 行为 的 研究 。 

因此 ， 计 算 机 科学 导论 必须 包含 多 个 主题 ， 我 们 将 在 接 下 来 的 章节 中 继续 探讨 这 个 内 容 。 
对 每 一 个 主题 ， 我 们 目标 就 是 要 介绍 这 门 学 科 的 核心 思想 、 当 前 的 研究 课题 以 及 一 些 用 于 本 领 
域 中 先进 知识 的 技术 。 在 学 习 过 程 中 ， 我 们 很 容易 忽视 整体 框架 。 因 此 ， 为 了 加 以 强调 ， 我 们 
现在 明确 一 些 定义 计算 科学 的 问题 以 及 学 习 的 重 氮 。 

e 算法 过 程 可 以 解决 什么 样 的 问题 ? 
怎样 才能 比较 容易 地 找到 算法 ? 

如 何 改进 表示 和 传达 算法 的 技术 ? 

算法 和 技术 的 知识 怎样 才能 够 用 来 制造 更 好 的 机 器 ? 

如 何 分 析 和 比较 不 同 算法 的 特征 ? 

如 何 使 用 算法 来 操作 信息 ? 

如 何 应 用 算法 来 产生 智能 行为 ? 

算法 的 应 用 对 计算 机 科学 界 与 计算 机 应 用 界 会 有 何 种 影响 ? 
注意 ， 算 法 研究 就 是 指 所 有 与 这 些 问 题 相 关 的 主题 ( 见 图 0-5)。 





算法 的 局 限 性 





算法 的 应 用 算法 的 执行 


算法 的 分 析 一 一 人 从 法 的 传达 


算法 的 此 现 算法 的 妻 示 


图 0-5 ”算法 在 计算 机 科学 中 的 核心 地 位 
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0.4 0.4 抽象 


抽象 概念 贯穿 计算 机 科学 的 研究 和 计算 机 系统 的 设计 , 因此 有 必要 在 绪论 中 做 一 简单 介绍 。 
术语 抽象 (abstraction) 在 本 书 中 的 意思 是 指 一 个 实体 外 部 特征 与 其 内 部 构成 细节 之 间 的 分 离 。 
抽象 使 我 们 可 以 忽略 一 些 复 杂 设 备 〈 如 计算 机 、 汽 车 和 微波 炉 等 ) 的 内 部 细节 ， 而 把 它们 作为 
单一 的 可 理解 的 单元 。 而 且 正 是 通过 抽象 ， 这 些 复杂 的 系统 才能 够 被 设计 和 生产 出 来 。 计算机 、 
汽车 和 微波 炉 由 若干 部 件 构成 ,而 这 些 部 件 又 分 别 由 更 小 的 部 件 构成 。 每 个 部 件 表示 一 层 抽象 ， 
在 此 层面 上 ， 该 部 件 的 使 用 与 它 内 部 构成 细节 是 分 隔 的 。 

运用 抽象 ， 我 们 能 够 建造 、 分 析 和 管理 大 型 的 复杂 计算 机 系统 ， 但 如 果 从 细节 的 层面 上 观 
察 其 整体 ， 就 会 使 人 不 知 所 措 。 在 每 一 个 抽象 层面 上 ， 我 们 都 把 此 系统 看 成 是 由 若干 称 为 抽象 
工具 〈abstract tool) 的 部 件 组 成 的 ， 而 暂时 忽略 这 些 部 件 的 内 部 构成 。 这 样 我 们 的 精力 就 集中 
了 ， 可 以 考虑 一 个 部 件 如 何 与 同一 层面 其 他 部 件 发 生 作 用 ， 以 及 如 何 把 这 些 部 件 作 为 一 个 整体 
形成 更 高 级 别 的 部 件 。 这 样 ， 我 们 就 可 以 理解 该 系统 中 与 手头 任务 有 关 的 那 部 分 ， 而 不 会 在 众 
多 的 细节 中 迷失 方向 。 

需要 强调 的 是 ， 抽 象 并 不 局 限于 科学 和 技术 领域 ， 它 是 一 门 重要 的 简化 技术 ， 我 们 的 社会 
所 形成 的 任何 一 种 生活 方式 都 离 不 开 抽 银 。 很 少 有 人 知道 ， 日 常生 活 中 各 种 各 样 的 便利 是 怎样 
实现 的 。 我 们 需要 吃饭 穿 衣 ， 但 却 不 能 都 自己 生产 ， 我 们 使 用 电器 设备 ， 但 不 需要 了 解 它 的 内 
部 技术 ， 我 们 享受 其 他 人 提供 的 服务 ， 但 不 需要 知道 他 们 的 专业 细节 。 对 每 一 项 新 的 发 展 只 有 
一 小 部 分 社会 成 员 专职 于 其 实现 ， 其 他 人 则 将 实现 的 结果 作为 抽象 工具 来 使 用 。 这 样 ， 社 会 的 
抽象 工具 仓库 扩大 了 ， 社 会 进一步 发 展 的 能 力也 增强 了 。 

抽象 这 一 话题 在 本 书 的 学 习 中 会 被 反复 提 及 。 我 们 将 了 解 到 ， 计 算 设 备 是 以 抽象 工具 的 层 
次 构建 的 。 我 们 还 会 看 到 ， 大 型 软件 系统 开发 是 以 模块 化 的 方式 完成 的 ， 其 中 每 个 模块 会 被 作 
为 较 大 模块 上 的 一 种 抽象 工具 。 此 外 ， 在 计算 机 科学 本 身 的 发 展 中 ， 抽 象 也 扮演 了 很 重要 的 角 
色 ， 有 了 它 ， 研 究 人 员 可 以 把 精力 集中 在 一 个 复杂 领域 中 的 特定 范围 。 实 际 上 ， 本 书 的 编排 也 
反映 了 该 科学 的 这 种 特征 一 -每 一 章 都 围绕 着 该 科学 一 个 特定 的 范围 ， 而 且 完 全 独立 于 其 他 各 
章 ， 但 所 有 这 些 章节 合 在 一 起 又 形成 了 对 该 科学 所 涉及 领域 的 全 面 介 绍 。 
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本 书 遵循 自 底 向 上 的 方法 学 习 计 算 机 科学 。 先 从 有 亲身 操作 经 验 的 主题 开始 ， 比 如 计算 机 
硬件 ， 继 而 引 出 比较 抽象 的 主题 ， 比 如 算法 复杂 性 和 可 计算 性 。 结 果 是 我 们 的 学 习 遵 循 了 这 样 
一 个 模式 ， 随 着 对 主题 理解 的 深入 ， 也 就 为 学 习 构建 了 规模 越 来 越 大 的 抽象 工具 。 

我 们 首先 学 习 的 主题 是 用 来 执行 算法 的 机 器 的 设计 和 构造 。 第 1 章 〈 数 据 存 展 ) 学 习 现 代 夺 
算 机 的 信息 编码 和 信息 存储 问题 ， 第 2 章 〈 数 据 操 控 ) 研究 简单 计算 机 的 内 部 基本 操作 。 虽 然 部 
分 学 习 内 容 涉及 技术 问题 ， 但 总 体 上 是 独立 具体 技术 的 。 也 贱 是 说 ， 像 数字 电路 设计 、 数 据 纺 
码 与 压缩 系统 以 及 计算 机 体系 结构 这 样 的 话题 在 广阔 的 技术 领域 中 都 很 重要 ， 并 且 不 管 技 术 发 
展 方向 如 何 ， 它 们 的 重要 性 不 会 降低 。 

在 第 3 章 〈 操 作 系统 ) 中 ， 我 们 将 学 习 控 制 一 台 夺 算 机 总 体操 作 的 软件 ， 这 种 软件 称 为 操作 
系统 。 操 作 系 统 控制 计算 机 与 其 外 部 世界 之 间 的 接口 : 保护 计算 机 及 其 内 部 所 存储 的 数据 ， 以 
免 被 非 授权 用 户 访问 ;允许 计算 机 用 户 请 求 热 行 各 种 程序 ;协调 内 部 活动 ， 以 满足 用 户 请 求 。 

在 第 4 章 《〈 组 网 及 因特网 ) 中 ， 我 们 将 学 习 如 何 相互 连接 计算 机 ， 以 构成 计算 机 网 络 ， 以 及 
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网 络 是 如 何 连 接 成 因特网 的 。 由 此 引出 诸如 网 络 协 议 、 因 特 网 结构 和 内 部 操作 、 万 维 网 以 及 诸 
多 安全 性 问题 等 主题 。 

第 5 章 〈 算 法 ) 比较 规范 地 介绍 了 算法 。 我 们 要 研究 算法 的 发 现 ， 明 确 几 种 基本 的 算法 结构 ， 
开发 几 项 表示 算法 的 初等 技术 ， 并 介绍 算法 的 有 效 性 和 正确 性 问题 。 

第 6 章 〈 程 序 设计 语言 ) 研究 的 问题 是 算法 表示 和 程序 开发 过 程 。 我 们 会 发 现 ， 人 们 在 不 断 
改 僚 和 柱 序 设计 技术 的 过 程 中 ， 已 经 创造 出 各 种 各 样 的 程序 设计 方法 学 或 方式 ， 而 每 一 种 都 有 自 
己 的 一 矢 程 序 设计 语言 。 我 们 将 研究 这 些 方式 和 语言 以 及 语法 和 语言 翻译 的 问题 。 

第 7 章 《〈 软 件 工程 》 介 绍 计算 机 科学 的 一 个 分 支 一 -软件 工程 。 软 件 工程 处 理 的 是 开发 大 型 
软件 系统 时 所 遇 到 的 问题 。 基 本 主题 就 是 ， 大 型 软件 系统 的 设计 是 一 项 复杂 的 任务 ， 会 遇 到 许多 
传统 工程 未 涉及 的 问题 。 因 此 ， 软 件 工程 这 一 学 科 已 经 成 为 计算 机 科学 中 -一 个 重要 的 研究 领域 ， 
从 工程 、 项 目 管理 、 人 力 资源 管理 、 程 序 设计 语言 设计 乃至 建筑 学 等 学 科 中 都 吸取 了 大 量 养分 。 

在 下 面 的 两 章 中 ， 我 们 将 学 习 数 据 在 计算 机 系统 中 的 组 织 方法 。 第 8 章 〈 数 据 抽象 ) 介绍 传 
统 上 用 于 在 计算 机 主 存储 器 中 组 织 数据 的 技术 ， 然 后 探索 数据 抽象 的 演变 发 展 ， 从 原 语 的 概念 
一 直到 今天 的 面向 对 象 式 技术 。 第 9 章 〈 数 据 库 系统 ) 介绍 传统 上 用 于 在 计算 机 海量 存储 器 中 组 
织 数 据 的 方法 ， 并 研究 如 何 实现 非 常 大 的 、 复 杂 的 数据 库 系 统 。 

在 第 10 章 〈 计 算 机 图 形 学 ) 中 ， 我 们 研究 图 形 和 动画 的 主题 ， 这 是 一 个 创建 和 图 像 化 虚拟 
地 界 的 领域 。 由 于 像 机 器 体系 结构 、 算 法 设计 、 数 据 结构 和 软件 工程 等 计算 机 科学 传统 领域 的 
上 发展， 图 形 和 动画 学 科 已 经 取得 了 显著 的 进展 ， 并 且 现 在 已 经 发 展 成 为 激动 人 心 、 充 满 活 力 的 
学 科 。 而 且 ， 这 个 领域 说 明了 计算 机 各 个 组 成 部 分 是 如 何 与 物理 、 艺 术 和 摄影 术 等 学 科 相 结合 
以 产生 显著 成 果 的 。 

从 第 11 章 《人工 智能 ) 中 ， 我 们 将 了 解 到 ， 为 了 开发 更 有 用 的 机 器 ， 计 算 机 科学 现 已 转向 
研究 处 于 领导 地 位 的 人 类 智能 ， 希 望 通过 对 我 们 自己 的 思维 推理 和 认 知 的 了 解 ， 研 究 者 能 设计 
出 模拟 这 些 过 程 的 算法 ， 从 而 把 这 些 能 力 传递 给 机 器 。 结 果 是 ， 计 算 机 科学 又 诞生 了 -一 个 称 为 
人 工 智能 的 领域 ， 它 非常 依赖 于 心理 学 、 生 物 学 和 语言 学 等 领域 的 研究 。 

我 们 的 研究 到 第 12 章 〈 计 算 理 论 ) 结束 ,在 这 一 章 中 ， 我 们 介绍 了 计算 机 科学 的 理论 基础 ， 
这 个 主题 使 我 们 了 解 了 算法 《和 这 样 的 机 器 ) 的 局 限 性 。 在 本 章 ， 我 们 不 但 明确 了 几 个 算法 上 
不 能 解决 的 《在 理论 上 也 是 超出 机 器 能 力 的 ) 问题 ， 而 且 认识 到 ， 解 决 其 他 许多 问题 需要 大 量 
的 时 间或 空间 ， 以 致 从 实践 的 角度 上 讲 也 是 不 可 解 的 。 因 此 ， 通 过 这 一 章 的 学 习 ， 我 们 就 能 够 
领悟 算法 系统 的 应 用 范围 和 局 限 性 。 

我 们 的 目标 是 ， 每 一 章 都 在 一 定 深度 上 使 读者 真正 理解 所 讨论 的 主题 。 我 们 希望 所 阐述 的 
计算 机 科学 知识 会 对 大 家 的 工作 有 所 帮助 一 一 使 读者 了 解 自己 所 生活 的 技术 社会 ， 打 好 跟随 科 
技 进步 自我 学 习 的 基础 。 
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计算 机 科学 的 进步 正 淡化 着 许多 差别 ， 而 这 些 差别 正 是 我 们 过 去 作出 某 些 决策 的 基准 ， 而 
且 计 算 机 科学 的 进步 也 向 社会 的 许多 准则 提出 了 挑战 。 在 法 律 上 ， 因 此 产生 了 某 些 疑 问 一 _ 知 
识 产权 的 度 以 及 伴随 这 个 所 有 权 的 权利 和 义务 。 在 伦理 上 ， 人 们 面临 着 许多 挑战 传统 社会 行 发 
准则 的 执 择 。 对 于 政府 ， 又 产生 了 许多 争议 一 “计算 机 技术 及 其 应 用 应 该 规范 到 什么 程度 ? 在 
哲学 上 ， 人 们 开始 了 智能 行为 的 存在 与 智能 本 身 的 存在 的 争论 。 同 时 ， 整 个 社会 也 在 讨论 ， 新 
的 计算 机 应 用 是 代表 新 的 自由 还 是 新 的 控制 ? 

尽管 这 些 话题 不 属于 计算 机 科学 本 身 的 一 部 分 ， 但 是 对 于 那些 想 涉 足 计算 机 领域 或 者 计算 
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机 相关 领域 的 人 ， 它 们 还 是 很 重要 的 。 科 学 新 发 现 经 常会 使 许多 应 用 产生 争议 ， 这 使 得 人 们 对 
相关 的 研究 人 员 产生 极 大 不 满 。 进 一 步 而 言 ， 伦 理 上 的 过 错 足 以 摧毁 本 可 以 很 成 功 的 事业 。 

计算 机 技术 的 发 展 给 大 们 提出 了 许多 难题 ， 因 而 具备 一 些 解决 问题 的 能 力 对 于 非 计算 机 领 
域 的 人 也 显得 十 分 重要 。 的 确 ， 计 算 机 技术 已 经 在 全 社会 普及 ， 几 乎 无 人 不 受 其 影响 。 

本 书 提供 了 一 些 技术 背景 ， 有 助 于 你 们 以 一 种 理智 的 思维 处 理 计算 机 科学 所 产生 的 问题 。 
然而 ， 计 算 机 科学 的 技术 知识 本 身 无 法 提供 所 涉及 问题 的 解决 办 法 。 因 此 ， 本 书 的 一 些 章节 细 
致 地 介绍 社会 、 伦 理 和 法 律 上 的 问题 ， 包 括 安全 性 、 软 件 所 有 权 和 义务 问题 、 数 据 库 技术 的 社 
会 影响 以 及 人 工 智能 发 展 的 后 果 。 

此 外 , 一 个 问题 通常 并 不 只 有 唯一 一 个 正确 的 答案 , 许多 有 效 的 解决 方案 都 是 在 对 立 的 (也 
许 都 是 有 理 的 ) 观点 之 间 进 行 折 中 的 。 因 此 ， 寻 找 解决 方案 通常 需要 这 样 的 能 力 ， 能 够 倾听 、 
辨别 其 他 各 种 观点 ， 开 展 理性 的 讨论 ， 并 在 获得 新 的 见解 时 改变 自己 的 观点 。 于 是 ， 本 书 每 章 
最 后 都 有 一 系列 “社会 问题 ” 研究 计算 机 科学 和 社会 的 关系 。 这 些 问 题 不 是 必须 作答 的 ， 而 是 
需要 思考 的 。 在 许多 情况 下 , 一 个 乍 看 毫 无 疑问 的 答案 在 发 现 其 他 可 能 性 时 就 不 能 令 你 满意 了 。 

在 结论 最 后 , 我 们 介绍 了 一 些 伦理 学 方法 ,这些 方法 是 哲学 家 在 基础 理论 的 研究 中 提出 的 ， 
从 而 产生 了 指导 决策 和 行为 的 原则 。 这 些 理论 大 体 可 以 归 类 为 ， 结 果 伦 理 、 职 责 伦 理 、 合 同 伦 
理 以 及 基于 性 格 伦理 。 你 也 许 希望 用 这 些 理论 作为 一 种 方法 去 处 理 本 书 中 星 现 的 伦理 问题 。 特 
别 是 ， 你 可 能 会 发 现 不 同 的 理论 会 导致 相反 的 结论 ， 从 而 将 隐藏 的 候选 方法 呈现 出 来 。 

结果 伦理 试图 分 析 的 问题 是 作出 各 种 选择 所 造成 的 后 果 。 最 突出 的 一 个 例子 就 是 “功利 主 
义 ” 一 一 “正确 ”的 决策 或 行动 就 是 可 以 带 给 社会 上 大 多 数 人 最 大 利益 的 。 和 车 看 ， 功 利 主义 似 
乎 很 合理 地 解决 了 伦理 上 的 难题 。 但 是 ， 从 绝对 性 上 看 ， 它 又 导致 了 许多 令 人 无 法 接受 的 后 果 。 
例如 ， 他 使 少数 人 要 服从 多 数 人 。 而 且 很 多 人 认为 ， 伦 理 理论 的 结果 方法 本 来 就 是 强调 结果 ， 
这 样 人 就 仅仅 被 当 作 实 现 结果 的 工具 而 不 是 有 意义 的 个 体 了 。 他 们 还 认为 ， 这 是 所 有 结果 伦理 
理论 的 一 个 最 基本 的 瑕 疫 。 

和 结果 伦理 相反 ， 职 责 伦理 并 不 考虑 决策 和 行动 的 结果 ， 它 认为 社会 成 员 本 身 应 该 有 职责 
或 义务 ， 因 此 又 产生 了 需要 解决 的 伦理 问题 。 例 如 ， 一 个 人 有 尊重 他 人 权利 的 义务 ， 那 么 无 论 
后 果 如 何 ， 他 都 要 反对 奴隶 制 。 另 一 方面 ， 反 对 职责 伦理 的 人 认为 ， 对 于 有 争议 的 职责 问题 ， 
它 是 无 法 提供 解决 方案 的 。 如 果 说 出 事实 真相 会 使 同事 失去 自信 ， 你 还 会 这 样 做 吗 ? 一 个 民族 
如 果 在 战争 中 自卫 ， 那 么 在 随后 的 战争 中 就 会 牺牲 很 多 公民 ， 这 个 民族 还 应 该 自卫 吗 ? 

合同 伦理 理论 首先 假设 社会 没有 任何 伦理 根基 。 在 这 种 纯 天 然 的 背景 下 ， 什 么 情况 都 可 能 
发 生 一 一 每 个 人 都 必须 自我 保护 ， 不 断 防止 他 人 的 进攻 。 因 此 ， 合 同 伦理 理论 认为 ， 社 会 成 员 
之 间 应 该 建立 “合同 ”。 例 如 ， 你 不 允 窃 我 ， 我 就 不 得 窃 你 。 进 而 ， 这 些 “ 合 同 ” 就 成 为 伦理 习 
惯 的 准绳 。 这 里 需要 指出 的 是 ， 合 同 伦理 理论 是 伦理 行为 的 动力 ， 因 为 否则 我 们 就 将 生活 得 很 
不 愉快 。 然 而 ， 反 对 合同 伦理 理论 的 人 认为 ， 它 不 能 为 伦理 难题 的 解决 提供 足够 广阔 的 基础 ， 
只 有 在 那些 已 经 建立 合同 的 领域 ， 它 才能 起 到 指导 作用 。( 在 没有 合同 约束 的 领域 ， 我 就 可 以 为 
所 和 欲 为 。) 尤其 是 新 技术 可 能 发 现 人 们 未 知 的 领域 ， 其 中 无 法 应 用 现存 的 伦理 合同 。 

性 格 伦理 《有 时 称 为 德行 伦理 ) 是 由 柏拉图 和 亚 里 士 多 德 提出 的 ， 它 指 的 是 ,， “好 习惯 ” 不 
是 运用 统一 规则 的 结果 ， 而 是 “良好 性 格 ” 的 自然 结果 。 当 一 个 人 解决 伦理 难题 时 ， 结 果 伦理 、 
职责 伦理 以 及 合同 伦理 认为 应 该 考虑 的 分 别 是 , “结果 会 怎样 呢 ? ”“ 我 的 职责 是 什么 呢 ? ”“ 我 
有 什么 合同 昵 ? ”而 性 格 伦理 考虑 的 是 ,“ 我 想 成 为 什么 样 的 人 呢 ? ”因此 ， 好 习惯 是 建立 在 好 
性 格 基础 上 的 ， 而 这 正 得 益 于 良好 的 教育 以 及 德行 习 刁 。 

向 不 同 专业 领域 人 士 教授 伦理 知识 时 ，- 一 般 以 性 格 伦理 为 基础 方法 ， 即 不 用 去 教授 专门 的 
伦理 理论 ， 而 是 举 一 些 案例 ， 暴 露 专业 领域 的 各 种 伦理 问题 。 然 后 通过 讨论 这 些 案例 的 利 束 ， 这 
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l10 第 0 章 绪 人 论 


此 专业 人 土 就 会 对 职业 生活 中 潜在 的 危险 有 一 个 更 清醒 、 更 深入 和 更 敏感 的 认识 了 ， 并 将 这 种 
认识 融入 到 他 们 的 性 格 中 。 这 就 是 每 章 最 后 设计 社会 问题 的 精神 所 在 。 


o7 全 辣 厦 -“ 二 


人 


人 


下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 管 这些 问 题 个 
是 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回 答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 。 
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我 们 现在 的 社会 不 同 于 计算 机 革命 之 前 的 社会 ， 人 们 已 经 广泛 接受 这 种 观点 。 现 在 的 
社会 是 比 过 去 的 好 ， 还 是 比 过 去 的 差 ? 如 果 你 在 社会 中 的 地 位 改变 了 ， 答 案 是 否 也 会 
改变 ? 

不 去 努力 了 解 技术 的 基础 知识 ， 却 又 想 积极 参与 到 当今 的 技术 社会 中 ， 这 种 做 法 是 合 
可 以 接受 ? 例如， 要 通过 表决 来 决定 支持 和 使 用 某 种 技术 ， 那 么 表决 者 是 否 有 责任 去 
了 解 那 种 技术 ?你 的 答案 是 否 取决 于 正在 考虑 哪 种 技术 ? 例如 ， 考 虑 使 用 核 技术 时 和 
考虑 使 用 计算 机 技术 时 ， 回 答 是 否 一 样 ? 

传统 上 人 们 有 权 选 择 现金 交易 方式 处 理 账 务 ， 因 而 不 需要 支付 服务 费用 。 然 而 ， 我 们 
经 济 生活 中 自动 化 程度 在 不 断 提高 ， 金 融 机 构 对 使 用 这 些 自动 化 系统 收取 服务 费用 。 
那么 , “服务 收费 不 公正 地 限制 了 人 们 参与 经 济 活动 ”这 种 说 法 是 否 正确 昵 ? 例如 ， 假 
设 雇主 用 支票 支付 雇员 的 工资 ， 并 且 所 有 金融 结构 都 对 支票 兑现 和 存款 收取 服务 费用 ， 
那么 雇员 是 否 因此 受到 不 公正 的 待遇 了 呢 ? 如 果 雇 主 坚持 通过 直接 存款 的 方式 支付 工资 , 屠 
该 怎么 办 呢 ? 

在 交互 式 电视 节目 中 ， 某 一 个 公司 可 能 从 孩子 那儿 获取 有 关 其 家 庭 的 信息 〈 也 许 是 明 
过 交互 式 游 戏 )， 那 应 该 控制 到 什么 程度 呢 ? 例如 ， 是 否 可 以 允许 公司 通过 孩子 得 知 其 
父母 的 购物 习惯 ? 那么 关于 孩子 自己 的 信息 呢 ? 

政府 对 计算 机 技术 及 其 应 用 的 法 规 管制 应 当 到 什么 程度 ? 例如 ， 考 虑 一 下 问题 3 和 问题 
4 中 提 到 的 问题 。 政 府 管制 的 依据 是 什么 ? 

关于 技术 ， 尤 其 是 计算 机 技术 ， 我 们 所 做 出 的 决策 会 对 我 们 的 后 代 有 多 大 的 影 啊 ? 

随 着 技术 的 进步 ， 我 们 的 教育 系统 不 断面 临 挑战 ， 要 重新 考虑 科目 安排 的 抽象 层次 。 
许多 问题 是 类 似 的 ， 如 某 项 技能 是 否 必 要 ， 是 否 允 许 学 生 依赖 某 种 抽象 工具 等 。 学 三 
角 时 ， 不 再 教学 生 如 何 利 用 函数 表 求 三 角 函 数 的 值 ， 而 是 允许 学 生 用 计算 器 作为 抽象 
工具 来 求 函数 值 。 有 些 人 认为 ， 长 除 也 应 该 让 位 于 抽象 。 还 有 哪些 主题 涉及 类 似 的 争 
论 ? 现代 的 文字 处 理 软件 是 否 会 使 人 们 不 需要 开发 书写 技能 ? 视频 技术 的 使 用 是 否 会 
在 将 来 的 某 一 天 取代 阅读 ”? 

所 有 公民 都 有 权 获 得 信息 ， 因 而 才 设 立 了 那么 多 公共 图 书馆 。 随 着 越 来 越 多 的 信息 通 
过 计算 机 技术 存储 和 传播 ， 是 否 每 一 位 公民 都 应 该 有 权利 访问 这 个 技术 系统 呢 ? 管 案 
如 果 是 肯定 的 ， 那 么 公共 图 书馆 是 否 应 该 为 这 种 访问 提供 渠道 呢 ? 

在 一 个 依靠 抽象 工具 的 社会 里 ， 会 产生 什么 样 的 伦理 问题 呢 ? 是 理 存在 这 样 的 情况 ， 
当 我 们 使 用 某 个 产品 或 某 项 服务 时 ， 不 了 解 它们 的 工作 原理 ， 不 了 解 生产 方法 就 有 悍 
道德 ? 亦 或 不 了 解 使 用 它 会 带 来 的 副作用 就 有 悖 道德 ? 

随 着 我 们 经 济 生活 的 逐步 自动 化 ， 政 府 监 督 公民 的 活动 变 得 很 容易 。 这 是 好 还 是 不 好 呢 ? 

George Orwell 在 他 的 小 说 《1984》 中 想象 的 哪些 技术 已 经 实现 ? 它们 的 使 用 方法 是 否 与 
Orwell 预 想 的 一 样 ? 

如 果 你 有 一 台 时 间 机 器 ， 你 想 生活 在 哪 一 个 历史 阶段 ? 有 你 想 带 走 的 现代 技术 吗 ? 你 
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所 选择 的 技术 可 以 脱离 其 他 的 技术 而 被 你 带 走 吗 ? 一 项 技术 可 以 在 多 大 程度 上 独立 于 
其 他 技术 ? 防止 远 室 效应 ， 却 又 接受 现代 医疗 ， 这 两 者 相符 吗 ? 

13. 假如 由 于 工作 关系 ， 你 必须 生活 在 另 一 种 文化 氛围 中 。 你 会 按照 自己 的 本 土 文化 习惯 
我 行 我 紊 ， 还 是 会 选择 这 御所 在 地 的 异域 生活 习俗 ? 对 这 个 问题 的 回答 ， 是 否 跟 穿 衣 
打扮 甚至 人 权 有 关 了 呢 ? 如 提 你 是 在 本 国生 活 ， 但 需要 处 理 各 种 外 来 文化 冲突 ， 那 你 会 
坚持 什么 赴 德 制 定 标准 ? 

14. 根据 你 对 以 上 问题 的 回答 ， 你 打算 文 持 0.6 节 中 的 哪 一 个 伦理 理论 ? 


课外 阅读 _ 


Goldstine, J. 本 TPe Compufer 方 om Pascal io Von Neurmarn. Princeton: Princeton University Press，1972. 

有 177a, JJM, ENceal amd 3Ocial 138Ues 胃 训 e TDrmarion 4se. New York: Springer-Verlag，1998. 

Mollenbofit，(. 民 . Aianmasof Foreotremn Fafperorihe Corpuer Ames: Iowa State University Press，1988. 

Neumann，P. G. COmIPDMIer Relared Ri Boston MA: Addison-Wesley, 1995. 

(uinn，M. JJ ENics jpDrihe njormnation 48ge, 2nd ed. Boston, MA: Addison-Wesley. 2006. 

Randell，B，7Pe Oreiny of Disial Computers. New York: Springer-Verlag, 1973. 

Spinello，R. A. and 卫 , T. Tavani, Readinss ia CyperEihics. Sudbury, MA: Jones and Bartlett, 2001. 

SwWade，D. TPe 六 erence Eripgine. New York: Viking, 2000. 

Tavanl， 再 . 工 三 训 ic Gnd Techazology: 下 1Rical snes 刘 GR Apoe OF prmmaton ad Conaniceation 
Jechnology New YoOrKk: Wiley,2004. 

Woolley，B. 7TPe Bride or Science Romanice, Reayom ad Byronr3 Daxghier New York: McGraw-Hill 1999. [18 


[ee 1 和 本 二 HE ET 1 六 一 中 = 一 本 古本 量 本 


作 主 sa 
数据 存储 





本 章 中 ， 我 们 学 习 有 关 计 算 机 中 数据 表示 和 数据 存储 的 内 容 。 我 们 要 研究 的 数据 类 
十 型 包括 文本 、 数值 、 图 像 、 音 频 和 视频 。 除 了 传统 计算 外 ， 本 章 的 很 多 内 容 还 涉及 
数字 摄影 、 音 频 /视频 录制 和 复制 以 及 远程 通信 等 领域 。 
我 们 首先 要 学 习 的 是 在 计算 机 科学 中 信息 如 何 编码 和 存储 。 第 -- 步 ， 我 们 要 讨论 计算 机 数 
据 仓 储 设 备 的 基础 知识 ， 然 后 进 - 步 研究 如 何 进行 信息 编码 并 存储 到 系统 内 部 。 我 们 还 将 探讨 
现 如 今 数据 存储 系统 的 各 个 分 支 ， 以 及 如 何 用 数据 压缩 、 纠 错 等 技术 来 克服 其 不 足 。 


二 1 位 和 位 存储 _ 


在 今天 的 计算 机 中 ， 信 息 是 以 0 和 1 的 模式 编码 的 。 这 些 数字 称 为 位 〈bit，binary digits 的 缩 
写 )。 尽 管 你 可 能 倾向 于 把 它们 与 数值 联系 在 一 起 ， 但 它们 的 确 只 是 些 符号 ， 其 意义 取决 于 正在 
处 理 的 应 用 。 有 时 用 来 表示 数值 ; 有 时 又 代表 字母 表 里 的 字符 和 标点 符号 ， 有 时 表示 图 像 ， 有 时 
还 表示 声音 。 


1.1.1 布尔 运算 


为 了 理解 单独 的 位 在 计算 机 中 是 如 何 进行 存储 和 操作 的 ， 这 里 我 们 假设 位 0 代表 假 值 ， 位 1 
代表 真 值 ， 这 样 表示 就 可 以 把 对 位 的 运算 看 作 是 对 真 / 假 值 的 操作 。 数学 家 乔治 . 布尔 (Georee 
Boole，1815 一 1864) 是 逻辑 数学 领域 的 先驱 ， 为 了 纪念 他 ， 人 们 把 处 理 真 / 假 值 的 运算 命名 为 
布尔 运算 (Boolean operation )。 3 个 基本 的 布尔 运算 是 AND〔〈 与 )、OR (或 ) 以 及 XOR〔〈 异 或 )， 
网 图 1-1。 这 些 运算 类 似 于 算术 运算 的 乘法 和 加 法 ， 因为 它们 结合 一 对 值 《运算 输入 )， 然后 得 
出 第 三 个 值 (运算 输出 )。 不 过 ， 与 算术 运算 不 同 的 是 ， 布尔 运算 结合 的 是 真 / 假 值 ， 而 不 是 数 
值 。 

布尔 运算 AND 是 用 于 反映 由 两 个 较 小 、 较 简单 语句 通过 连接 词 AND 组 成 的 语句 的 真 / 假 值 。 


PAND O 
其 中 ，P 代 表 一 个 语句 ，@ 代 表 另 外 一 个 语句 。 例 如 ， 
Kermit 是 一 只 青蛙 AND Piggy 小 姐 是 一 位 演员 


AND 运 算 的 输入 是 复合 语句 分 句 的 真 / 假 值 ; 恰 出 则 是 复合 语句 本 身 的 真 / 假 值 。 因 为 P AND 台 
语句 的 值 只 有 在 其 两 个 分 句 都 是 真 时 才 为 真 ， 所 以 可 以 得 出 结论 ，1 AND 1 古 真 的 ， 而 其 他 所 
有 情况 的 输出 值 都 将 是 0， 如 图 1-1 所 示 。 


ah 抽 下 让 生生 二 生生 人 CCPH 1 Re 全 下 


” XODR 运 算 


0 
关 (IR 
0 





图 1-1 布尔 运算 AND、OR 和 XOR 
问 理 ，OR 运 算是 基于 如 下 形式 的 复合 语句 
PORO 


同样 ，P 代 表 一 个 语句 ，@ 代 表 另 外 一 个 语句 。 当 其 中 至 少 有 一 个 分 句 为 真 时 ， 语句 才 为 真 ， 见 
图 1-1。 

类 语 中 没有 一 个 连词 可 以 单独 表示 XOR。 当 两 个 分 句 一 个 为 1 〈 真 )， 另 一 个 为 0〔 假 》 时 ， 
此 XOR 运 算 值 是 真 。 例 如 ，PXOR @ 语 句 的 意思 是 “或 者 是 P， 或 者 是 O， 但 不 会 是 两 个 共存 ” 
( 简 言 之 ， 当 两 分 句 不 同时 ，XOR 运 算 为 真 。) 

NOT 〈 非 ) 运算 是 另 一 个 布尔 运算 。 它 区 别 于 AND、OR 和 XOR， 因 为 它 只 有 一 个 输入 。 
它 的 输出 就 是 输入 值 的 相反 值 。 如 果 NOT 运 算 的 输入 值 是 真 ， 那 么 它 的 输出 值 则 为 候 ， 反之 亦 
然 。 因 此 ， 如 果 NOT 运 算 的 输入 是 下 面 的 语句 的 真 / 假 值 : 


Fozzie is a bear. 
那么 ， 其 输出 就 是 如 下 语句 的 真 / 假 值 : 


Fozzlie 1$ not a bear. 


1.1.2” 门 和 触发 器 


门 〈gate) 指 的 是 一 种 设备 ， 给 出 一 种 布尔 运算 输入 值 时 ， 可 以 得 出 该 布尔 运算 的 输出 值 。 
门 可 以 通过 很 多 种 技术 制造 出 来 ， 如 齿轮 、 继 电器 和 光学 设备 。 今 天 的 计算 机 中 ， 门 经 常 是 通 
过 微 电 子 电路 来 实现 的 ， 其 中 数字 0 和 1 由 电压 电 平 表示 。 不 过 ,我们 不 需要 关注 这 些 细节 问题 。 
对 于 我 们 来 说 ， 知 道 用 符号 形式 来 表示 门 就 足够 了 ， 如 图 1-2 所 示 。 注 意 : 与 、 或 、 异 或 及 非 门 
分 别 是 用 不 同形 状 的 图 表示 的 ， 输 入 值 在 一 边 ， 输 出 值 在 另 一 边 。 

这 样 的 门 为 构造 计算 机 提供 了 基础 构件 。 构 造 计算 机 时 ， 图 1-3 所 示 的 电路 是 一 个 重要 的 环 
T， 该 电路 是 一 个 称 为 触发 器 的 电路 特例 。 触 发 器 (flip-flop) 是 一 个 可 以 产生 0 或 1 输出 值 的 电 
路 ， 筷 的 值 会 一 直 保 持 不 变 ， 除 非 其 他 电路 过 来 的 临时 脉冲 使 其 改变 成 另 一 个 值 。 换 各 话说 ， 
答 出 什 是 在 外 界 的 刺激 下 在 两 个 值 之 间 相 互 转换 的 。 如 图 1-3 所 示 ， 只 要 电路 输入 值 一 直 都 是 0， 
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那么 输出 值 〈 无 论 是 0 还 是 1) 就 不 会 改变 。 不 过 ， 如 果 在 它 的 上 输入 端 临 时 放置 一 个 1， 那 么 将 
强制 其 输出 值 为 1， 反 之 ， 在 它 下 输入 端 临时 放置 一 个 1， 那么 将 强制 其 输出 值 为 0。 


与 门 ， 或 门 
输入 | 一 多 输入 | > 一人 
输入 “输出 输入 输出 
全 冯 总 口 引 日 
加 :时 和 性 , 诗 
王 总 上 站 1 
上 上 法 二 业 “于 上 
和 寞 或 门 非 门 
输入 > 输入 ”一 二 > 一 箱 出 
输入 -输出 输入 ”输出 
总 站 口 二 
日 王 旺 了 了 
二 电 荆 
下 证 吕 
图 1-2 ”与 、 或 、 异 或 以 及 非 门 的 图 例 及 输入 和 输出 值 
输入 
输入 


图 1-3 ”一 个 简单 的 触发 器 电路 


我 们 来 仔细 研究 一 下 这 个 问题 。 在 我 们 不 知道 图 1-3 电 路 当前 输出 值 的 情况 下 ， 假设 上 面 的 

得 入 值 变 为 1， 而 下 面 的 输入 值 仍 为 0〔( 见 图 1-4a)， 那么 不 管 这 个 门 另外 一 个 输入 值 是 什么 ， 或 
盯 的 输出 值 都 将 为 1。 这 时 ， 与 门 的 两 个 输入 值 都 为 1， 因为 这 个 门 的 另外 一 个 输入 值 已 经 为 ] 

《由 经 过 触发 器 下 输入 端的 非 门 获得 )。 与 门 的 输出 值 于 是 变 成 1， 也 贱 是 意味 着 现在 或 门 的 第 二 

次 输入 值 将 为 1 ( 见 图 1-4b)。 这 样 就 可 以 确保 ， 即使 触发 器 上 面 的 输入 值 变 回 0( 见 图 1-4c)， 或 


1 的 输出 值 也 会 保持 为 1。 总 之 ， 触发 器 的 输出 值 已 经 为 1， 那 么 输入 值 变 回 0 时 ， 其 输出 值 仍 然 
保持 不 变 。 





(al 将 上 面 的 输入 置 1 tb) 这 使 或 门 的 输出 为 1， 接 着 使 与 门 的 输出 为 1 


0 
(e) 符 上 面 的 输入 变 为 0 之 后 ， 由 于 与 门 的 输出 为 1， 所 以 或 门 的 答 出 仍然 为 1 
图 1-4 将 一 个 触发 器 的 输出 值 设置 为 1 


问 理 ， 在 下 输入 端 上 临时 放置 数值 1 会 强制 触发 器 的 输出 值 为 0， 而 且 输 入 值 变 回 0 时 ， 恰 出 
值 仍 然 保 持 不 变 。 

我 们 介绍 触发 器 电路 〈 见 图 1-3 和 图 1-4) 是 基于 双重 原因 的 。 首 先 ， 它 向 我 们 展示 了 设备 
是 如 何 通 过 门 制造 出 来 的 ， 这 是 一 个 数字 电路 的 设计 过 程 ， 在 计算 机 工程 领域 是 一 个 很 重要 的 
肥 题 。 事 实 上 ， 在 计算 机 工程 中 ， 触 发 器 只 是 诸多 基础 工具 电路 的 一 种 。 

第 二 ， 触 发 器 的 概念 为 抽象 和 使 用 抽象 工具 提供 了 一 个 例子 。 事 实 上 ， 可 以 用 多 种 方法 去 
设计 一 个 触发 器 。 图 1-5 介 绍 了 其 中 一 种 方法 ， 如 果 你 用 这 个 电路 做 实验 就 会 发 现 ， 尽管 它 有 着 
个 同 的 内 部 结构 ， 但 它 与 图 1-3 中 的 外 部 特性 是 一 样 的 。 当 设计 .一 个 触发 器 时 ， 计算 机 工程 师 会 
考虑 各 种 替代 方法 ， 其 中 把 门 电路 当 作 构建 块 来 使 用 。 一 旦 触 友 器 和 其 他 基本 电路 结构 设计 完 
毕 ， 工 程 师 就 可 以 使 用 这 些 电路 作为 构建 块 去 构造 更 复杂 的 电路 。 这 样 ， 直 算 机 电路 的 设计 就 
会 呈现 一 种 层次 结构 ， 其 中 每 一 层 都 使 用 较 低 层次 的 构件 作为 抽象 工具 。 


输入 


输入 输出 
图 1-5 ”构建 触发 器 的 另 一 种 方法 
介绍 触发 器 的 第 三 个 目的 在 于 ， 触发 器 是 在 现代 计算 机 中 存储 二 进 制 位 的 一 -种 方法 。 更 精 


确 地 说 ， 触 发 器 可 以 被 设置 为 具有 0 或 1 的 输出 值 。 其 他 电路 可 以 通过 发 送 脉冲 到 触发 器 的 输入 
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端 调 整 这 个 值 , 还 有 其 他 一 些 电路 可 以 用 触发 器 的 答 出 作为 它们 的 输入 来 对 存储 的 值 进行 啊 应 。 
这 样 ， 许 多 触发 器 被 构造 成 非常 小 的 电子 电路 ， 可 以 用 在 计算 机 内 作为 记录 信息 的 一 种 方法 ， 
这 些 信 息 被 编码 成 0 和 1 的 模式 。 实 际 上 ， 众所周知 的 超大 规模 集成 (Very Large-scale integration， 
VLSI) 技术 支持 几 千 个 电子 元 件 被 构造 在 一 个 唱片 ( 称 为 芯片 (chip)) 上 ， 用 来 创建 在 控制 电 
路 中 含有 成 千 上 万 个 触发 器 的 微型 设备 。 然 后 ， 这 个 设备 用 作 构 建 计算 机 系统 的 抽象 工具 。 事 


实 上 ， 在 某 些 情 况 下 ，VLSI 被 用 来 在 单 块 芯片 上 创建 整个 计算 机 系统 。 


1.1.3 十 六 进 制 记 数 法 
当 考 虑 计算 机 内 部 活动 时 ,我们 必须 和 位 串 打 交道 , 有 一 些 


位 训 会 非常 长 。 一 个 长 的 位 串 常 被 称 为 流 〈stream)。 但 是 ， 人 位 模式 十 交 进 制 表示 
脑 不 容易 理解 流 。 仅 仅 抄录 位 模式 的 101101010011 就 很 乏味 且 容 0 
易 出 错误 。 因 此 ,为 了 简化 这 种 位 模式 的 表示 方法 ， 我 们 常 使 用 0001 1 
一 种 称 为 十 六 进 制 记 数 法 (hexadecimal notation) 的 简写 符号 来 00 1 < 
表示 位 ， 它 是 利用 计算 机 位 模式 的 长 度 为 4 的 倍数 这 样 一 个 事实 。 0100 
而 制定 的 ， 这 种 记 数 法 意味 着 一 个 12 位 串 只 需要 3 个 符号 束 可 以 0101 5 
进行 表示 。 加 aa 
图 1-6 介 绍 了 十 六 进 制 编码 系统 。 左 边 一 列 展 示 的 是 所 有 长 1000 8 
度 为 4 的 位 模式 ， 右边 一 列 展 示 的 是 十 六 进 制 中 代表 左边 位 模式 1001 3 
的 符号 。 通 过 这 个 系统 ，10110101 形 式 表示 为 B5。 这 是 通过 把 1013 
位 模式 拆 分 为 长 度 为 4 的 子 串 ， 然后 又 用 十 六 进 制 的 符号 代替 每 1100 
一 个 子 串 一 -1011 由 B 来 表示 ，0101 由 5 来 表示 。 同 理 ， 十 六 位 1 3 
模式 1010010011001000 可 以 缩减 成 更 合理 的 形式 A4C8。 1111 F 


第 2 章 将 广泛 使 用 十 六 进 制 记 数 法 ， 由 此 你 就 能 体会 到 它 的 
效率 。 


问题 与 练习 
1. 什么 样 的 位 模式 输入 可 以 使 得 下 面 的 电路 输出 值 为 1? 


输入 上 > ) 一 > 输出 


2 对 于 图 1.3 中 的 触发 器 ， 我 们 在 文中 强调 ， 下 输入 端 放置 1 (保持 上 输入 端 为 0) 


的 输出 为 0。 描 述 一 下 这 种 情况 触发 器 内 部 的 活动 序列 。 


图 1-6 “十 六 进 制 编码 系统 


3. 假定 图 1-5 中 的 触发 器 的 输入 都 为 0， 描 述 一 下 当 上 输入 端 临时 设 为 1 时 所 发 生 的 话 动 序 刚 。 


4. 协调 一 台 计 算 机 各 部 分 的 活动 是 经 常 性 的 工作 ， 它 是 通过 给 那些 需要 协调 的 各 部 分 电路 连 信 一 个 脉 
动 信号 〈《 称 为 时 钟 ) 来 实现 的 。 随 着 时 钟 在 值 0 和 和 1 之 间 交 奉 变 换 ， 它 对 征 了 各 种 电路 元 件 。 王 余 所 示 
的 例子 就 是 此 类 电路 的 一 部 分 ， 它 包含 了 图 1-3 中 所 示 的 触发 器 。 什 么 样 的 时 钙 伺 可 以 使 租 发 器 屏蔽 
该 电路 输入 值 的 影响 ?. 什么 样 的 时 钟 值 可 以 使 触发 器 响应 该 电路 的 输入 什 ? 
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5$. a， 如 果 一 个 或 门 的 输出 值 传 递 给 一 个 非 门 ， 那 么 这 个 组 台电 路 计算 的 布尔 运算 称 为 或 非 ， 当 且 仅 当 
输入 值 都 为 0 时 ， 输 出 值 为 1。 或 非 门 的 符号 和 或 门 的 条 号 尖 似 ， 只 是 输出 有 一 个 圆圈 。 下面 的 电 
路 包 合 一 个 与 门 和 两 个 非 门 。 那 各 这 个 电路 计算 称 为 讨 么 布尔 还 算 ? 
输入 
答 出 


输入 
b. 如 果 一 个 与 门 的 输出 值 传 递 给 了 一 个 非 门 ， 那 么 这 个 组 合 电 路 计算 的 布尔 运算 称 为 与 非 。 当 且 仅 
汉 输 入 值 都 为 1 时 ， 输 出 值 为 1。 与 非 门 的 符号 和 与 门 的 符号 类 似 ， 只 是 输出 有 一 个 圆圈 。 下面 的 
电路 包含 与 非 门 ， 那 么 这 个 电路 完成 什么 布尔 运算 ? 
输入 
输出 


输入 


6. 用 十 六 进 制 记 数 法 来 表示 下 面 的 位 模式 。 
a0I10101011110010 hb. 111010000101010100010111 cc.01001000 


7. 下 面 的 十 六 进 制 模式 表示 什么 位 模式 ? 
a_ SFD97 b. 610A c. ABCD d.0100 


下 


二 滞 RE 重 让 让 FF 二 HEEi aa 计 - 上 和 二 二 Fi- 生 二 汪 区 a 和 于 二 丢 c 有 由 二 二 ci 和 


为 了 人 存储 数据 ， 计 算 机 包含 大 量 的 电路 〈 如 触发 器 )， 每 一 个 电路 能 够 存储 单独 的 一 个 位 。 
这 种 位 存储 器 被 称 为 计算 机 的 主 存储 器 〈main memory )。 


1.2.1 存储 请 结构 

计算 机 主 存 储 器 是 以 称 为 存储 单元 (cell) 的 可 管理 单位 组 织 起 来 的 ， 一 个 典型 的 存储 单元 
容量 是 8 位 。( 一 个 8 位 的 串 称 为 一 个 字 节 (〈byte)， 因 此 一 个 典型 的 存储 单元 容量 是 一 个 字 节 。) 
在 像 微 波 炉 这 样 的 家 用 电器 中 所 使 用 的 小 型 计算 机 的 主 存储 器 ， 仅 仅 包 含 几 百 个 存储 单元 ， 但 
是 大 型 计算 机 的 主 存储 器 可 能 有 上 亿 个 存储 单元 。 


尽管 计算 机 中 设 有 左 或 右 的 概念 ， 但 是 我 们 通常 假设 存储 单元 的 位 是 排 成 一 行 的 。 该 行 的 


左 问 称 为 高 位 端 (high-order end)， 石 端 称 为 低位 端 (low-order end)。 高 位 端的 最 左 一 位 称 作 高 
位 或 最 高 有 效 位 《most significant bit)。 取 这 个 名 称 是 因为 ， 如 果 把 存储 单元 里 的 内 容 解释 为 数 
值 ， 那 么 这 一 位 就 是 该 数 的 最 高 有 效 数 字 。 类 似 地 ， 低 位 端的 最 右 一 位 称 为 低位 或 最 低 有 效 位 
(least significant bit)。 于 是 ， 我 们 可 以 按 图 1-7 那 样 描述 字 节 型 存储 单元 的 内 容 。 


ea 一 一 一 本 


图 1-7” 字 节 型 存储 单元 的 结构 
为 了 区 分 计算 机 主 存储 器 中 的 各 存储 单元 , 每 一 个 存储 单元 都 被 赋予 了 一 个 唯一 的 “名 字 风 
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称 为 地 址 〈address)。 这 类 似 于 通过 地 址 确定 一 个 城市 的 房屋 。 不 过 ， 对 于 存储 器 单元 ， 所 用 地 
竹 部 是 用 数字 表示 的 。 更 精确 地 说 ， 我 们 把 所 有 的 存储 单元 都 看 作 是 排 成 一 行 的 ， 并 按照 这 个 
顺序 从 0 开始 编号 。 这 样 的 编 址 系统 不 仅 为 我 们 提供 了 唯一 标识 每 个 存储 单元 的 方法 ， 而且 也 给 
仓储 单元 赋予 了 顺序 的 概念 〈 见 图 1-8)， 这 样 就 有 了 诸如 “下 一 个 单元 “前 一 个 单元 ”的 说 
法 。 





多 1-8 按 地 址 排列 的 存储 单元 


将 主 存储 器 的 存储 单元 和 存储 单元 的 位 都 进行 排序 ， 承 产生 一 个 重要 结果 ， 即 计算 机 主 存 
储 右 的 所 有 二 进 制 位 本 质 上 被 排 成 了 一 -长 行 。 四 而 这 个 长 行 上 的 片段 就 可 以 存储 比 单个 存储 单 
元 要 长 的 位 模式 。 特 别 是 ， 我 们 只 需要 通过 两 个 连续 的 存储 单元 就 可 以 存储 16 位 的 串 。 

为 了 做 成 一 台 计 算 机 的 主 存储 器 ， 实际 存放 二 进 制 位 的 电路 还 组 合 了 其 他 的 电路 ， 这 些 电 
路 使 得 其 他 电路 可 以 从 存储 单元 中 存 入 和 取出 数据 。 以 这 种 方式 ， 其 他 电路 可 以 通过 电信 和 号 请 
求 从 存储 器 中 得 到 指定 地 址 的 内 容 《 称 为 读 操作 )， 或 者 请 求 把 某 个 位 模式 存放 到 指定 地 址 的 存 
依 单 元 里 〈 称 为 写 操作 )。 

由 于 计算 机 的 主 存储 器 由 单个 的 、 可 编 址 的 存储 单元 组 成 ， 所 以 这 些 存 储 单元 可 以 根据 需 
要 独立 存 取 。 为 了 反映 用 任何 顺序 存 取 存 储 单 元 的 能 力 ， 计算 机 的 主 存储 器 常 被 称 为 随机 存 取 
厂 (random access memory，RAMD。 主人 存储 器 的 这 种 随机 存 取 特 性 与 1.3 节 中 将 要 讨论 的 海量 存 
储 系统 形成 鲜明 对 比 ， 其 中 长 二 进 制 被 作为 合并 块 来 操纵 。 

冬 旨 我 们 已 经 介绍 触发 器 可 以 作为 一 种 二 进 制 位 的 存储 方法 ， 但 是 在 现代 的 大 多 数 计算 机 
中 ， 随机 存储 器 都 是 用 其 他 可 以 提供 更 小 型 化 和 更 快 响应 时 间 的 技术 制造 的 ， 许多 技术 可 以 存 
储 快 速 消散 的 微小 电子 。 因 此 ， 这 些 设备 需要 附加 的 电路 ， 称 为 刷新 电路 ， 可 以 在 1s 内 反复 补 
充电 子 很 多 次 。 因 为 它 的 这 种 不 稳定 性 ， 捷 以 通过 这 种 技术 构造 的 计算 机 存储 器 常 被 称 为 动态 
存储 器 〈dynamic memory )， 于 是 就 产生 了 术语 DRAM ( 读 作 “DEE-ram”)， 用 来 表示 动态 RAM 
取 者 ， 有 时 候 关 于 动态 存储 器 也 会 用 SDRAM〔 读 作 “ES-DEE-ram”)， 用 来 表示 同步 动态 RAM 
有 沙 取 这 种 附加 的 技术 可 以 缩短 从 存储 单元 取出 信息 所 需要 的 时 间 。 


1.2.2 存储 器 容量 的 度量 


正如 在 第 2 章 要 学 到 的 ， 如 采 主 存储 器 中 存储 单元 的 总 数 是 2 的 宕 ， 者 么 设计 是 很 方便 的 。 
因此 早期 计算 机 存储 器 的 大 小 通常 以 1024 (2 ) 个 存储 单元 为 度量 单位 。 因为 1024 接 近 于 数值 
1000, 所 以 计算 界 的 许多 人 采用 前 缀 千 (Kilo) 来 表示 这 个 单位 。 也 就 是 说 ， 术语 于 字 节 (kilobyte， 
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简写 KB ) 用 于 表示 1024 字 节 。 因此 有 4096 个 存储 单元 的 计算 机 被 称 为 有 4KB 存 储 器 〈4096=4 
x1024)。 随 者 存储 器 容量 的 增 大 ， 这 种 度量 单位 也 随 之 增加 ， 和 包括 如 前 组 净 (mega )， 表 
示 1048 576 (2”)、 前 缀 吉 〈giga ) 表示 1 073 741 824 〈230)。 于 是 ， 兆 字 节 (megabyte，MB) 
和 言 字 节 〈gigabyte，GB) 这 样 的 单位 就 流行 了 。 

遗憾 的 是 ， 这 种 前 缀 用 法 属于 术语 的 误 用 ， 因为 这 些 前 缀 已 经 是 其 他 领域 用 于 指称 10 的 圭 
的 单位 。 例如， 在 度量 距离 时 ， 千 米 〈kilometer) 指 的 是 1000 米 “my)， 在 度量 无 线 电 频 率 时 ， 
兆赫 〈megahertz ) 指 的 是 1 000 000 赫 兹 〈Hz)。 更 为 严重 的 是 ， 已 经 有 些 计 算 机 厂商 混淆 了 两 
组 术语 ， 即 用 KB 表示 1024 字 节 ， 而 用 MB 表示 1000 KB (1 024 000 字 节 )。 不 用 说 ， 这 些 差 别 已 
经 和 韦 成 了 多 年 来 的 混乱 和 误解 。 

为 了 羡 明 这 些 问 题 ， 有 人 建议 是 保留 千 〈kilo)、 兆 (mega) 和 吉 〈giga) 这 些 前 组 ， 作 为 
10 的 蜂 的 单位 ， 并 引入 新 的 前 缀 约 千 位 〈kibi，kilobinary 的 缩写 ， 俏 写 为 Ki)、 约 兆 位 〈mebi， 
megabinary 的 缩写 ， 简 写 为 Mi) 和 约 吉 位 〈gibi，gigabinary 的 缩写 ， 简 写 为 Gi)， 用 来 表示 相应 
的 2 的 寡 的 度量 单位 。 根 据 这 种 方法 ， 术 语 约 千 字 节 《kibibyte， 简 写 KiB ) 就 指称 1024 字 节 ， 而 
于 字 节 《〈kilobyte， 简 写 KB) 则 指称 1000 字 节 。 这 些 前 缀 是 否 能 够 成 为 流行 术语 还 有 待考 验 。 
但 束 目 前 而 言 ， 前 缀 千 〈kilo )、 兆 (mega ) 和 吉 〈giga ) 传统 上 的 误 用 在 计算 界 的 主 存储 器 方 
面 仍然 是 根深 带 固 的 ， 因 此 我 们 在 涉及 数据 存储 时 仍 将 遵循 这 个 传统 。 可 证， 建议 中 的 前 级 约 
王位 〈kibi)、 约 兆 位 (megi) 和 约 吉 位 〈gibi) 的 确 代 表 了 解决 这 个 愈 显 突出 问题 的 一 种 尝试 ， 
而 用 今 后 使 用 术语 干 字 节 (kilobyte) 和 兆 字 节 (megabyte) 时 要 小 心 ， 


问题 与 练习 
1. 如 果 地 址 为 5 的 存储 单元 存 有 值 8， 那么 在 将 值 $ 写 入 6 号 存储 单元 和 将 5 号 存储 单元 的 内 容 移 到 6 号 存 
储 单元 之 间 有 什么 差别 ? 
2 假定 你 想 交 换 存 储 在 2 号 和 3 号 存储 单元 中 的 值 。 那 么 下 面 的 步骤 错 在 哪里 ? 
步骤 1: 把 2 号 存储 单元 中 的 内 容 移 到 3 号 存储 单元 。 
步骤 2;， 把 3 号 存储 单元 中 的 内 容 移 到 ?号 存储 单元 。 
衣 设 计 能 够 正确 交换 这 两 个 存储 单元 内 容 的 步骤 。 
3. 拥有 4KB 〔 准 确 说 是 KiB) 的 计算 机 存储 器 里 有 多 少 个 - - 进 制 位 ? 
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由 于 计算 机 主 存储 器 的 不 稳定 性 和 容量 的 限制 ， 大 多 数 计算 机 都 有 称 为 海量 存储 系统 (mass 
storage) 或 者 称 为 辅助 存储 器 的 附加 存储 设备 ， 包 括 磁 盘 、CD 盘 、DVD 租 、 磁带 、 闪 存 驱 动 器 
《所 有 这 些 我 们 稍 后 会 讨论 )。 相 对 于 主 存储 器 ， 每 量 人 存储 系统 的 优点 是 更 稳定 、 容 量 大 、 价 格 
低 ， 并 且 在 许多 情况 下 ， 为 了 存档 的 需要 可 以 从 计算 机 上 方便 地 取 下 这 类 存储 设备 。 

术语 联机 〈on-line) 和 脱 机 《〈off-line) 通常 分 别 用 来 描述 那些 既 能 接 入 计算 机 又 能 从 计算 
机 上 移 除 的 设备 。 联 机 ， 意 味 着 设备 或 信息 已 经 与 计算 机 连接 ， 不 需要 人 的 干预 就 可 以 使 用 。 脱 
机 ， 意 味 着 必须 先 有 人 的 干预 ， 设备 和 信息 才 可 被 计算 机 使 用 或 许 这 个 设备 需要 接 通 电源 ， 
或 许 包含 该 信息 的 介质 需要 揪 到 某 机 械 装 团 里。 

海量 存储 系统 的 主要 不 足 之 处 是 ， 它 们 一 - 般 都 需要 机 械 运 动 ， 而 主 存储 器 的 所 有 工作 都 是 
由 电子 器 件 实现 的 ， 因 此 比 起 计算 机 主 存储 器 来 ， 紫 量 存储 系统 的 数据 存 取 需 要 花费 更 长 的 
时 间 。 
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1.3.1 磁 学 系统 


很 多 年 以 来 ， 磁 技术 已 经 占据 了 海量 存储 领域 。 我 们 今天 使 用 最 多 的 是 磁盘 (magnetic 
disk)。 人 尼 里 面 是 落 的 、 可 以 旋转 的 盘 片 ， 表 面 有 磁 介 质 的 涂 层 用 以 存储 数据 《图 1-9)， 读 / 写 磁 
头 安装 在 盘 片 的 上 面 和 【或 ) 下 面 ， 当 盘 片 旋转 时 ， 每 个 磁头 在 盘 片 上 面 或 下 面相 对 于 称 为 道 
(track) 的 圆圈 转动 。 移 动 磁头 时 ， 可 以 对 各 个 同心 的 道 进行 存 取 。 在 很 多 情况 下 ， 一 个 磁盘 存 
依 系 统 包 含 才干 个 安装 在 同一 根 轴 上 的 盘 片 ， 一 个 盘 片 在 另 一 个 盘 片 的 上 面 ， 盘 片 之 间 留 有 足 
够 的 距离 ， 使 得 磁头 可 以 在 盘 片 之 间 滑 动 。 这 种 情况 下 ， 所 有 的 磁头 是 一 起 移动 的 。 因 此 ， 每 
当 磁 头 移 到 新 的 位 置 时 ， 新 的 一 组 道 ， 称 为 柱 面 (cylinder)， 就 可 以 进行 存 取 操 作 了 。 


将 道 划分 为 而 区 


伐 昼 


二 





读 / 写 磁头 





_ 存 取 忌 


崩 运 动 方向 


厂 盘 旋转 方向 


图 1-9 ”磁盘 存储 系统 


因为 一 个 道 可 以 包含 的 数据 通常 比 我 们 每 一 次 要 处 理 的 数据 多 ， 所 以 每 个 道 划分 成 若干 个 
小 弧 区 ， 称 为 扇 区 (sector)。 记 录 在 每 个 扇 区 上 的 信息 是 连续 的 二 进 制 位 串 。 磁盘 上 所 有 的 扁 
区 包含 相同 数目 的 二 进 制 位 (典型 的 容量 是 512 个 字 节 到 若干 KB )， 而 且 在 最 简单 的 磁盘 存储 系 
统 里 ， 每 一 个 道 分 为 相同 数目 的 扇 区 。 因 此 ， 盘 片 边缘 道 扇 区 上 存储 的 位 密度 要 小 于 靠近 盘 片 
中 心 让 上 存储 的 位 ， 这 是 因为 外 道 要 长 于 内 道 的 缘故 。 事 实 上 ， 在 大 容量 磁盘 存储 器 系统 里 ， 
边缘 道 包含 的 扇 区 要 远 多 于 靠近 中 心 的 道 ， 这 种 存储 能 力 常 通过 一 种 称 作 区 位 记录 (zoned_bit 
recording，ZBR) 的 技术 得 以 应 用 。 运 用 区 位 记录 ， 一 些 相 邻 的 道 被 统一 命名 为 区 ， 一 个 典型 
的 盘 片 大 约 包 含 10 个 区 。 一 个 区 的 所 有 道 有 相同 数目 的 扇 区 ， 但 是 靠 外 的 区 中 每 一 个 道 包 含 的 
出 区 比 靠 内 的 区 包含 的 多 。 因 此 ， 盘 片 边缘 的 存储 空间 利用 率 要 高 于 传统 磁盘 系统 。 不 考虑 细 
书 ， 一 个 磁盘 存储 系统 包含 许多 独立 的 扇 区 ， 每 一 个 而 区 又 可 以 作为 独立 的 位 串 进 行 存 取 。 

志和 证 区 的 位 置 不 是 磁盘 物理 结构 的 固定 部 分 ， 相 反 ， 它们 是 通过 称 为 磁盘 格式 化 
(formatting) 或 初始 化 的 过 程 磁化 形成 的 。 这 个 过 程 通常 是 由 磁盘 的 厂家 完成 的 ， 出 厂 的 此 类 
盘 称 为 格式 化 盘 。 大 多 数 计算 机 系统 都 能 够 执行 此 项 任务 。 所 以 ， 如 果 一 个 磁盘 的 格式 化 信息 
航 破 十 了， 那么 这 个 磁盘 可 以 重新 格式 化 ， 不 过 这 种 操作 将 会 丢失 原先 记录 在 磁盘 上 的 所 有 
信息 。 

一 个 全 盘 存储 系统 的 容量 取决 于 所 用 静 片 数目 以 及 所 划分 道 与 扇 区 的 密度 。 仅 由 一 张 塑料 
盘 片 组 成 的 低 容量 系统 称 为 磁盘 〈diskette)， 有 时 也 称 为 软 表 (floppy disk)， 后 者 强调 了 它 的 
天 活性 。 软 盘 很 容易 插入 到 相应 的 读 / 写 装置 里 ， 也 容易 取出 和 保存 ， 通 币 用 作 信 息 脱 机 存储 设 
备 。 不 过 ， 普 通 的 3.5 英 寸 软 盘 容 量 仅 有 1.44 MB， 因此 它们 很 快 被 其 他 技术 取代 了 。 

大 容量 磁盘 系统 的 容量 可 达 几 GB， 它 可 能 有 5~10 个 刚 硬 的 手 片 ， 并 安 半 在 同一 个 办 上 。 由 
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于 这 种 磁盘 系统 所 用 的 盘 片 是 刚 硬 的 ， 所 以 称 为 硬盘 系统 ， 用 以 区 别 于 软盘 系统 。 为 了 使 盘 片 
可 以 比较 快 地 旋转 ， 硬 盘 系统 里 的 磁头 不 接触 盘 片 表面 ， 而 是 “ 浮 ” 在 上 面 。 磁 头 与 盘 片 表面 
的 空 际 非常 小 ， 以 至 于 一 颗 灰 尘 都 会 阻塞 在 磁头 和 盘 片 之 间 的 空 险 ， 造 成 破坏 〈 这 个 现象 称 为 
划 道 )。 因 此 ， 硬 盘 系 统 出 厂 前 已 被 密封 在 盒子 里 。 

有 几 个 标准 可 以 用 来 评估 一 个 磁盘 系统 的 性 能 : 〈1) 寻 道 时 间 (seek time)， 读 / 写 磁头 从 -- 
“个 道 移 到 另 一 个 道 所 需要 的 时 间 ;， (2) 旋转 延迟 〈rotation delay) 或 等 待 时 间 (latency time )， 
熏 卢 旋转 一 周 所 需要 时 间 的 一 半 ， 也 就 是 读 / 写 磁头 到 达 所 要 求 道 后 ,等待 盘 片 旋转 使 读 / 写 磁头 
位 于 所 要 存 取 的 数据 〈 扇 区 ) 上 所 需要 的 时 间 ;，(3) 存 取 时 间 (access time)， 即 寻 道 时 间 和 等 
竺 时 间 之 和 ; (4) 传输 速率 〈transfer rate )， 从 磁盘 上 读 出 或 写 入 数据 的 速率 。( 需 要 注意 的 是 ， 
在 区 位 记录 存储 情况 下 ， 盘 片 旋 转 一 次 边缘 道 通过 读 / 写 磁头 传递 的 数据 要 多 于 内 区 道 ， 因 此 ， 
数据 传输 速率 依 所 使 用 盘 片 部 分 的 不 同 而 变化 。) 

优盘 系统 的 性 能 通常 大 大 优 于 软盘 。 硬 盘 系 统 里 的 读 / 写 磁头 不 接触 盘 片 表面 ， 盘 片 的 旋转 
速度 可 达 每 分 钟 儿 和 干 转 ， 而 软盘 系统 里 的 盘 片 只 有 固定 的 每 分 钟 300 转 。 因 此 ， 人 硬盘 系统 的 传输 
速率 通常 以 每 秒 几 MB 来 度量 ， 这 上 比 软盘 系统 大 得 多 ， 后 者 计量 单位 仅 为 每 秒 几 KB。 

因为 磁盘 系统 的 操作 需要 物理 运动 ， 所 以 软盘 系统 和 硬盘 系统 都 难以 与 电子 电路 的 速度 相 
比 。 电 子 电路 延迟 时 间 的 度量 单位 是 纳 秒 (十 亿 分 之 一 秒 ) 甚至 更 小 ， 而 磁盘 系统 的 寻 道 时 间 、 
邦 待 时 间 和 存 取 时 间 是 以 毫秒 〈 千 分 之 一 秒 ) 度量 的 。 因 此 ， 与 电子 电路 等 待 结 果 的 时 间 相 比 ， 
从 磁盘 系统 检索 信息 所 需要 的 时 间 是 一 个 漫长 的 过 程 。 

倍 盘 存储 系统 不 是 唯一 应 用 磁 技术 的 海量 存储 设备 。 一 种 更 古老 的 形式 是 磁带 (magnetic 
tape) (多 图 1-10)， 在 这 些 系 统 里 ， 信 息 存 储 在 一 条 细 薄 的 塑料 带 的 磁 涂 屋 上 ， 而 塑料 带 则 绕 在 
人防 带 郑 轴 上 作为 存储 器 。 为 了 存 取 数 据 ， 磁 带 装 到 称 为 磁带 驱动 器 的 设备 里 ， 并 可 以 在 计算 机 
控制 下 读 带 、 写 带 和 倒 带 。 磁 带 驱动 器 有 大 有 小 ， 小 至 盒 式 机 ， 大 至 比较 老式 的 大 型 盘 式 机 。 
而 僵 式 机 又 称 为 流 式 磁带 机 ， 磁 带 的 外 表 与 立体 声 收 音 机 类 似 。 虽 然 这 些 磁带 机 的 存储 容量 依 
赖 于 所 使 用 的 格式 ， 但 是 大 多 数 都 达到 几 GB。 








王 \\ 
OO | 
屿 / 写 头 雪 省 
所 
让 琵 带 
__| | 一 
带 运动 方向 


图 1-10 ”磁带 存储 装置 


磁带 的 一 个 主要 缺点 是 ， 由 于 在 磁带 卷轴 之 间 要 移动 的 带子 很 长 ， 所 以 在 一 条 磁带 不 同位 
置 之 间 移 动 非常 耗费 时 间 。 于 是 相对 于 磁盘 系统 而 言 ， 磁 带 系 统 的 存 取 时 间 比 较 长 ， 因 为 磁 坦 
的 读 / 写 磁头 只 需要 做 短 的 移动 就 可 以 在 不 同 的 扇 区 存 取 。 因此 ， 磁带 机 对 于 联机 的 数据 存储 设备 
不 是 很 常用 。 但 是 ， 磁 带 技 术 常 应 用 在 脱 机 档案 数据 存储 中 ， 原 因 是 它 具 有 容量 大 、 可 散人 性 高 和 
性 价 比 好 等 优势 ， 尽 管 其 他 技术 ， 如 DVD、 闪 存 等 的 进步 ， 正 迅速 地 挑战 磁带 系统 最 后 的 阵地 。 
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1.3.2 光学 系统 


尺 一 类 海量 存储 器 所 应 用 的 是 光学 技术 ， 交 盘 (Compact Disk，CD) 就 是 其 中 的 一 种 。 光 得 
的 直径 为 12cm《〈 大 约 $ 英 寸 )， 由 涂 着 光洁 保护 层 的 反射 材料 制 成 。 通过 在 反射 层 上 创建 偏差 的 方 
法 在 光盘 上 面 记录 信息 。 激光 束 通过 监视 CD 快速 旋转 时 反射 层 的 不 规则 反射 偏差 来 读 取 信息 。 

CD 技术 最 初 是 用 于 音频 录制 ， 使 用 称 为 数字 音频 光盘 〈CD-DA) 的 记录 格式 ， 而 今天 CD 
作为 计算 机 的 数据 存储 设备 ， 实 质 上 使 用 的 仍 是 同样 的 格式 。 尤 其 是 ， CD 上 的 信息 是 存储 在 一 
条 道上 ， 它 呈 螺 旋 形 缠绕 在 CD 上 ， 很 像 老式 唱片 里 的 止 模 ， 不 过 与 老式 唱片 不 同 的 是 ，CD 上 
的 道 是 由 内 至 外 的 〈 见 图 1-11)。 这 条 道 划 分 为 称 为 扇 区 的 单元 ， 每 个 扇 区 都 有 自己 的 标识 ， 数 


” 据 存储 容量 2KB， 相当 于 在 音频 录制 时 < s 的 音乐 。 


数据 记录 在 分 为 若干 扇 区 的 
道上 ， 得 门 外 螺旋 形 旋转 
| 


CD 





汪 盘 运动 方向 


贸 1-11 CD 存储 格式 


需要 注意 的 是 ， 盘 片 外 部 边缘 的 螺旋 道 距 离 比 内 部 道 距离 要 长 . 为 了 使 CD 的 存储 能 力 达 到 
最 大 ， 信 息 就 按照 统一 的 线性 密度 ， 存 储 在 整个 螺旋 形 的 道上 。 这 就 意味 着 ， 螺 旋 形 道上 靠 外 
这 缘 的 环 道 存 放 的 信息 比 内 部 的 环 道 多 。 所 以 ， 如 果盘 片 旋转 一 整 圈 ， 激 光束 在 扫描 螺旋 形 道 
外 边 时 读 到 的 而 区 个 数 要 比 里 边 多 。 因 而， 为 了 获得 统一 的 数据 传输 速率 ， 根 据 激光 训 在 盘 片 
上 的 位 置 ，CD-DA 播 放 器 能 够 调整 静 片 的 旋转 速度 。 但 是 作为 计算 机 数据 存储 器 的 大 多 数 CD 
驱动 器 ， 盘 片 旋 转 的 速度 是 比较 迅速 和 恒定 的 ， 因此 其 CD 驱动 器 必须 适应 数据 传输 速率 的 变化 。 

由 于 采用 这 种 设计 思想 ， CD 和 仓 储 系 统 在 处 理 长 且 连 续 的 数据 种 〈 如 音乐 复制 等 ) 时 表现 最 
好 。 相 反 ， 当 一 个 应 用 需要 随机 存 取 数 据 项 时 ， 磁盘 存储 器 所 用 的 方法 《〈 单 个 、 同 心 道 被 划分 
成 独立 人 存 取 肩 区 的 形式 ) 就 优 于 CD 所 用 的 螺旋 形 方 法 。 

传统 CD 的 存储 容量 是 600~700MB。 但 是 ，DVD (digital versatile disk)2 可 提供 达到 几 个 
GB 的 人 存储 容量 ， 它 由 多 个 半 透 明 的 层面 构成 ， 精确 聚焦 的 激光 可 以 识别 其 不 同 的 层面 。 这 种 盘 
片 能 够 存储 元 长 的 多 媒体 信息 ， 包 括 完 整 的 电影 。 


1.3.3 内存 驱 动 嚣 


基于 磁 学 和 光学 技术 的 海量 存储 系统 的 一 个 普遍 特征 是 ， 通过 物理 运动 来 存储 和 读 取信 息 ， 
例如 ， 旋 转 磁 盘 、 移 动 读 / 写 磁 头 和 扫描 激光 束 等 。 这 就 意味 着 ， 数据 存储 和 读 取 的 速度 比 电子 
电路 的 速度 要 慢 。 闪 存 〈flash memory) 技术 就 有 克服 这 个 缺点 的 潜力 。 在 一 个 闪存 系统 里 ， 用 
电子 信和 号 将 二 进 制 位 直接 送 到 存储 介质 中 ， 该 介质 中 ， 电子 信号 使 得 二 氧化 硅 的 微小 晶 格 截获 
电子 ， 从 而 转换 惩 电子 电路 的 性 质 。 加 为 这 学 微 小 晶 格 能 够 保持 截获 的 电子 很 多 年 ， 所 以 闪存 


技术 适合 存储 脱 机 数据 。 


山 DVD 全 称 也 作 digital videodisc。 一 “编者 注 
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尽管 存储 在 闪存 系统 里 的 数据 ， 能 够 像 在 RAM 应 用 中 一 样 ， 以 小 字 节 单元 存 取 ， 但 是 现代 
技术 规定 存储 的 数据 应 以 批量 擦 写 。 不 过 反复 的 擦 写 会 逐渐 损坏 二 氧化 硅 的 晶 格 ， 这 就 意味 着 
现今 的 闪存 技术 不 适合 主 存储 器 应 用 ， 主 存储 器 的 内 容 在 一 秒 钟 可 能 改变 许多 次 。 然 而 ， 在 某 
些 应 用 里 ， 改 变 可 以 被 控制 在 一 个 合理 的 水 平 上 ， 例 如 数码 相机 、 移 动 电 话 、 手 提 式 PDA， 所 
以 内 存 已 经 成 为 海量 存储 技术 的 一 个 选择 。 的 确 ， 因 为 闪存 对 物理 震动 不 敏感 〈 与 磁 学 系统 和 
认 学 系统 不 同 )， 它 在 便携 式 应 用 中 的 潜力 是 诱 人 的 。 

内 存 设 备 称 为 闪存 驱动 器 (flash drive)， 容 量 可 达到 几 GB， 可 用 于 一 般 的 海量 存储 应 用 。 
闪存 设备 被 封装 在 小 的 塑料 格子 里 ， 长 约 3 英 寸 ， 每 一 端 有 一 个 可 以 取 下 的 帽 ， 当 驱动 器 处 于 及 
机 状态 时 ， 可 以 保护 各 个 设备 的 电子 连接 器 。 这 些 便 携 设备 容量 大 ， 很 容易 连接 到 计算 机 以 及 
从 计算 机 断 开 ， 对 于 脱 机 状态 的 数据 存储 是 很 理想 的 选择 。 不 过 ， 由 于 它们 的 微小 存储 晶 格 的 
缺点 ， 当 涉及 真正 长 期 应 用 时 ， 它 们 不 如 光学 盘 片 可 靠 。 


1.3.4 文件 存储 及 检索 


海量 存储 系统 中 的 信息 一 般 被 分 组 为 较 大 的 单元 ， 称 为 文件 (file)。 典 型 的 文件 可 能 由 文 
本 、 照 片 、 程 序 、 音 乐 录音 或 者 一 组 有 关公 司 员工 的 数据 组 成 。 我 们 已 经 了 解 到 ， 海 量 存储 设 
备 规定 这 些 文件 要 以 较 小 的 多 字 节 单位 进行 存储 和 检索 。 例 如 ， 存 储 在 磁盘 上 的 文件 必须 按照 
厢 区 操作 ， 每 个 扇 区 都 有 固定 的 规格 。 符 合 存储 设备 特性 的 数据 块 称 为 物理 记录 〈physical 
record)。 因 此 ， 海 量 存储 系统 中 的 大 文件 通常 包含 多 个 物理 记录 。 

与 这 种 物理 记录 划分 相对 ， 文 件 通 常 有 其 自然 划分 ， 这 是 由 它 所 表示 的 信息 决定 。 例 如 ， 
一 个 包含 公司 员工 信息 的 文件 由 许多 单元 组 成 ， 其 中 每 个 单元 包含 一 个 员工 的 信息 ， 一 个 有 关 
文本 的 文件 包含 段落 或 页 。 这 些 自然 产生 的 数据 块 称 为 运 辑 记录 〈logical record )。 

过 辑 记 录 通 常 由 称 为 字段 〈field) 的 较 小 的 单元 组 成 。 例 如 ， 一 个 包含 员工 信息 的 逻辑 记 
有 孙 大 致 由 姓名 、 地 址 、 员 工 标识 号 等 这 样 的 字段 组 成 。 有 时 候 ， 文 件 的 每 一 个 逻辑 记录 是 由 一 
个 特定 的 字段 唯一 标识 出 来 的 《也 许 是 一 个 员工 的 标识 号 、 一 个 部 门 标号 或 者 是 目录 项 标号 )。 
这 样 的 标识 字段 称 为 键 字段 〈key field)， 键 字段 中 的 值 称 为 键 (key )。 

过 和 辑 记录 的 规格 很 少 能 与 海量 存储 系统 的 物理 记录 相 匹 配 。 因 此 ， 人 们 可 能 会 发 现 若干 逻 
辑 记 录 存 放 在 一 个 物理 记录 里 ， 或 者 一 个 逻辑 记录 存放 在 两 个 或 者 更 多 的 物理 记录 里 〔〈 见 图 
1-12)。 因 此 , 海量 存储 系统 的 信息 检索 需要 一 定 的 整理 工作 。 这 个 问题 的 一 个 常用 解决 方法 是 ， 
在 主 存储 器 里 从 出 一 个 足够 大 的 区 域 ， 用 于 存放 若干 物理 记录 并 以 此 存储 空间 作为 重组 区 域 。 
也 就 是 说 ， 与 物理 记录 兼容 的 数据 块 可 以 在 主 存储 区 与 海量 存储 系统 之 间 传输 ， 主 存储 区 的 数 
据 能 够 根据 逻辑 记录 引用 。 


运 辑 记 录 对 应 于 数据 内 的 自然 划分 





物理 记录 对 应 于 遍 区 的 大 小 
图 1-12 ”磁盘 上 的 逻辑 记录 与 物理 记录 
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这 种 仓储 区 域 称 为 缓冲 区 (buffer)。 一 般 情 况 下 ， 缓冲 区 通常 是 用 于 一 个 设备 向 另 一 个 设 
备 传输 的 过 程 中 临时 存储 数据 的 区 域 。 例 如 ， 现 代 的 打印 机 都 有 自己 的 存储 电路 ， 其 大 部 分 作 
为 缓冲 区 ， 用 于 保存 该 打印 机 已 经 收 到 但 还 没有 打印 的 那 部 分 文档 。 


问题 与 练习 

1. 重 盘 系统 的 表 片 比 软盘 系统 的 盘 片 旋转 得 快 这 一 事实 耽 明 鳃 秀 系 统 的 优势 是 什么 ? 

2 当 数 据 记 录 到 多 盘 片 存储 系统 时 , 我 们 是 应 该 写 满 臣 盘 片 后 再 写 另 一 张 盘 片 , 还 是 应 该 写 满 一 个 桩 
历 后 骨 写 另 一 个 柱 面 ? 

3. 为 什么 在 一 个 预订 系统 里 ， 那 些 需要 经 常 更 新 的 数据 要 存储 在 磁盘 里 ， 而 不 是 CD 或 DVD 于。 

' 使 用 字 处 理 程序 修改 文档 时 ， 有 时 添加 一 段 文本 都 厅 会 很 明 业 地 增加 海量 存储 器 中 文件 的 大 小 , 而 有 
时 一 个 符 叶 的 增加 就 会 使 文件 增加 几 百 个 字 节 。 为 什 衣 ? 

5. 相对 于 本 节 介 绍 的 海量 存储 系统 ， 闪 存 驱 动 器 有 什么 优势 ? 

. 什么 是 缓冲 区 ? 


和 


[本 自 


1.4_ 用 位 模式 表示 信息 
-一 ”四 亿 人 收工 衣 丰 信和 已 
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在 研究 了 位 存储 的 技术 后 ， 现 在 来 了 解 如 何 将 信息 编码 为 位 模式 。 我 们 的 学 习 集中 在 对 文 
本 、 数 字数 据 、 图 像 以 及 声音 等 编码 的 流行 方法 上 。 每 一 个 编码 系统 都 可 能 会 影响 到 典型 的 计 
算 机 用 户 。 我 们 的 目标 是 充分 了 解 这 些 技术 ， 以 便 知 道 应 用 这 些 技术 的 效果 . 


1.4.1 文本 的 表示 


文本 形式 的 信息 通常 由 一 种 代码 表示 ， 其 中 文本 中 的 每 一 个 不 同 的 符号 〈 例 如 字母 和 标点 
符号 等 ) 均 赋 予 其 相应 的 唯一 的 位 模式 。 这 样 ， 文本 就 表示 为 一 个 长 的 位 串 ， 连 续 的 位 模式 逐 
一 表示 诛 文 本 中 的 符号 。 

在 20 世 纪 的 40 年 代 至 50 年 代 ， 人 们 设计 了 许多 这 样 的 代码 ， 并 结合 不 同 的 设备 使 用 ， 随 之 
增加 了 相应 的 通信 和 问题. 为 了 缓解 这 种 情况 ， 美国 国家 标准 化 学 会 (American National Standards 
Instutute, ANSI) 采用 了 美国 信息 交换 标准 码 (American Standard Code for Inftormation JInerchange， 
ASCIH)。 这 种 代码 使 用 长 度 为 7 的 位 模式 来 表示 大 小 写 英文 字母 、 标点 符号 、 数 字 0~9 以 及 某 些 
控制 字符 ， 如 换行 、 回 车 与 制 表 符 等 。 今 天 ， ASCH 码 经 党 扩展 为 8 位 位 模式 ， 方 法 就 是 在 每 个 
7 位 位 模式 的 最 高 端 添 加 一 个 0。 这 个 技术 不 仅 使 所 产生 的 代码 的 位 模式 与 字 节 型 存储 单元 相 匹 
配 ， 而 且 还 提供 了 附加 的 128 个 位 模式 (通过 给 附加 的 位 赋予 数值 1)， 可 以 表示 原来 ASCII 码 所 
不 包括 的 符号 。 不 过 ， 由 于 厂 商 们 部 倾向 于 给 这 些 附 加 模式 加 上 自己 的 解释 ， 因而 经 常 使 用 这 
些 模式 的 数据 很 难 从 一 个 厂商 的 应 用 传输 到 另外 -一 个 厂 次 的 应 用 。 

8 位 模式 的 一 部 分 ASCH 码 可 见 附录 A。 利 用 这 个 附录 ， 我 们 可 以 将 位 模式 


0Ol001D000 DO1100101 01L1I01100 0110110D0 01101111 自得 1O1 了 3 看 
解码 为 报 文 “Hello.”， 见 图 1-13， 


bobolnooDo LT1L CD161 中 1 站 让 昌 1 开 人 了 0 人 110JT3411 吕 吕 于 必 工业 下 和 
有 所 | | 站 


图 1-13 报 文 “Hello” 的 ASCII 码 
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尽管 多 年 来 ASCII 码 一 直 占 据 主要 地 位 ， 但 是 现在 其 他 更 具 扩 展 性 的 代码 也 越 来 越 普及 
这 些 代码 能 够 表示 各 种 语言 的 文档 资料 。 其 中 之 一 是 Unicode， 它 是 由 硬 牟 及 软件 的 多 家 主 呈 | 
音 其 同 研制 开发 的 ， 并 很 快 得 到 计算 界 的 支持 。 这 种 代码 采用 唯一 的 16 位 模式 来 表示 每 村 介 符 。 -38 
号 。 因 此 ，Unicode 由 65 536 个 不 同 的 位 模式 组 成 一 足以 表示 用 中 文 、 日 文 和 希 伯 来 文 产 壤 所 
书写 的 文档 资料 。 


美国 国家 标准 化 学 会 
美国 国家 标准 化 学 会 (ANSI) 成 立 于 1918 年 ， 是 由 工程 师 协会 和 政府 代表 共同 组 成 的 小 
型 团体 ， 作 为 非 赢利 性 组 织 来 规范 私人 企业 自发 标准 的 开发 。 今天，ANSI 有 1300 多 个 成 员 ， 
其 中 自 括 商 业 组 织 、 专 业 组 织 、 行 业 协会 以 及 政府 代表 。 ANSI 的 总 部 设 在 纽约 ， 它 代表 美国 
作为 ISO 的 成 员 。 它 的 网 站 是 http:y/Awww.ansl .crGS 
其 他 国家 类 似 的 组 织 包 括 澳 大 利 亚 标准 组 织 、 加 拿 大 标准 委员 会 、 中 国 国家 质量 技术 监 
督 局 、 德 国标 准 学 会 、 日 本 工业 标准 委员 会 .墨西哥 标准 指导 委员 会 、 俄 罗斯 联邦 国家 标准 
和 度量 委员 会 、 瑞 士 标准 化 协会 和 英国 标准 学 会 


国际 标准 化 组 织 〈International Organization for Standardlzatilon， ISO， 联 想到 希腊 文 isos， 
意 为 公平 ) 已 经 开发 了 一 种 可 能 与 Unicode 码 竞争 的 代码 标准 。 由 于 使 用 了 32 位 模式 ， 该 种 编码 
系统 足以 表示 几 十 亿 个 不 同 的 符号 。 


ISO 一 国 际 标准 化 组 级 
国际 标准 化 组 织 〔( 第 称 为 ISO ) 建立 于 1947 年 ， 是 世界 范围 标准 化 实体 联 旺 ， 这 些 实 体 
分 别 来 自 各 个 国家 。 现 如 今 , 它 的 总 部 设 在 瑞士 日 内 瓦 , 有 100 多 个 实体 会 员 和 许多 观察 会 员 ， 
( 观察 会 员 通常 是 来 自 没 有 国家 认可 标准 化 实体 的 国家 的 标准 化 实体 。 这 些 会 员 不 能 直接 参与 
标准 的 开发 ， 但 可 以 了 解 ISO 的 活动 . ) [ISO 的 网 站 是 httPpyiyAAwww-iSsoD.cho。 


一 个 文件 由 一 长 串 根据 ASCIH 或 Unicode 编 码 的 符号 组 成 ， 则 常 称 其 为 文本 文件 〈text file)。 
重要 的 是 要 区 别 下 面 两 类 文件 ， 一 类 是 由 称 为 文本 编辑 器 〈text editor， 或 常 称 为 简单 编辑 认 ) 
的 实用 程序 操作 的 简单 文本 文件 ; 一 类 是 由 字 处 理 程序 (word processor) 产生 的 较 复 杂 的 文件 。 
两 者 都 是 由 文本 材料 组 成 的 ， 但 是 ， 文 本 文件 只 包含 文本 中 各 个 字符 的 编码 ， 而 由 字 处 理 程序 
产生 的 文件 还 包含 许多 特征 码 ， 用 于 表示 字体 变化 、 对 齐 信息 等 。 此 外 ， 字 处 理 程序 在 琢 丰 广 
本 本 身 时 甚至 使 用 特征 码 而 不 遵循 ASCI 和 Unicode 标 准 。 


1.4.2 ”数值 的 表示 


当 所 记录 的 信息 只 有 数值 时 ， 以 字符 编码 的 形式 存储 效率 就 会 很 低 。 为 了 了 解 原因 ， 让 我 
们 来 看 看 数值 25 的 存储 问题 。 如 果 我 们 坚持 用 ASCI[ 编 码 符号 来 存储 ， 每 个 符号 一 个 字 节 ， 示 
么 总 共 需 要 16 个 二 进 制 位 。 此 外 ， 用 16 个 二 进 制 位 可 以 存储 的 最 大 数 是 99。 不 过 ， 我 们 马上 珊 
可 以 看 到 ， 使 用 二 进 制 记 数 法 〈binary notation)，16 个 二 进 制 位 则 可 以 仔 刁 0 一 65 535 范 围 内 的 
任何 一 个 整数 。 因 此 ， 二 进 制 记 数 法 〈 或 它 的 变 体 ) 被 广泛 应 用 于 计算 机 存储 器 中 数值 数据 
的 编码 。 

二 进 制 记 数 法 是 一 种 数值 表示 方法 ， 只 使 用 数字 0 和 1; 区 别 于 传统 的 使 用 数字 0、1、2、 了 3 
4 5、6、7、8 和 9 的 十 进 制 记 数 系统 。 我 们 将 在 1.5 节 中 更 详细 地 研究 二 进 制 记 数 法 ， 现 在 ， 我 
们 只 需要 初步 了 解 该 系统 。 我 们 来 考虑 一 种 老式 的 汽车 里 程 表 ， 它 的 显示 轮 只 包含 数字 0 和 1， 


26 第 1 章 数据 存储 


而 不 是 传统 的 十 进 制 数字 0 一 9。 里 程 表 以 全 0 读数 开始 ， 当 汽车 行驶 几 英 里 时 ， 最 右 方 的 说 动 显 
示 轮 从 0 旋转 至 1; 当 这 个 1 旋转 回 0 时 ， 使 得 一 个 1 就 出 现在 它 的 左边 ， 因 此 产生 模式 10;, 接着 右 
边 的 0 旋转 为 1， 产 生 11。 这 时 ， 最 右边 的 从 1 旋转 回 0， 使 得 它 左 边 的 1 也 旋转 回 0。 这 就 使 另 一 
个 1 出 现在 第 3 位 上， 产生 模式 100。 简 言 之 ， 在 我 们 驾驶 汽车 时 将 看 到 下 列 顺 序 的 里 程 表 读数 ; 


0000 
0001 
0010 
0011 
0100 
0101 
0110 
0111 
1000 


这 个 序列 包括 了 整数 0 一 8 的 二 进 制 表 示 。 尽 管 有 些 元 长 乏味 ， 但 是 我 们 可 以 扩展 这 种 计数 
技术 ,用 以 发 现 16 个 1 组 成 的 位 模式 是 可 以 表示 数值 65 535 的 , 这 就 证 实 了 我 们 的 说 法 :0 一 65 535 
范围 内 的 任何 整数 都 可 以 利用 16 个 二 进 制 位 进行 编码 。 

由 于 它 的 高 效 性 ， 数 字 信 息 通常 都 是 以 二 进 制 记 数 法 的 形式 存储 的 ， 而 不 用 符号 编码 。 我 
们 称 其 为 “二 进 制 记 数 法 的 形式 ” 这 是 因为 ， 上 面 描述 的 简单 二 进 制 系统 只 是 机 器 应 用 到 的 若 
干 数值 存储 技术 的 基础 。 二 进 制 系统 的 某 些 变 体 将 在 本 章 的 后 面 讨 论 。 现 在 我 们 只 需要 知道 ， 
称 为 二 进 制 补 码 〈two's complement) 记 数 法 〈 见 1.6 节 ) 的 系统 通常 用 于 存储 整数 ， 因 为 它 提供 


了 一 种 便利 地 表示 负数 和 正 数 的 方法 。 为 了 表示 4， 和 了 这样 带 有 分 数 部 分 的 数 ， 我 们 要 使 用 
另 一 种 称 为 浮 点 (floating-point) 记 数 法 的 方法 〈 见 1.7 节 )。 


1.4.3 ”图像 的 表示 


图 像 表示 为 一 组 点 ， 每 一 个 点 称 为 一 个 像素 (pixel， 是 Picture_ element 的 缩写 )， 每 个 像素 
的 显示 被 编码 ， 整 个 图 像 就 表示 成 这 些 已 编码 像素 的 集合 ， 这 个 集合 被 称 为 位 图 (bit map)， 这 
种 方法 很 常用 ， 因 为 许多 显示 设备 〈 如 打印 机 和 计算 机 显示 器 ) 都 是 在 像素 的 概念 上 进行 操作 
的 。 因 此 ， 位 图 格式 的 图 像 更 便于 显示 。 

在 位 图 中 的 像素 编码 方式 随 着 应 用 的 不 同 而 不 同 。 黑 白 图 像 就 编码 为 一 个 表示 图 像 各 行 像 
素 的 很 长 的 位 串 ， 其 中 每 一 个 位 取 值 是 1 还 是 0 则 取决 于 相对 应 像素 是 黑 还 是 白 。 大 多 数 的 传真 
机 采用 此 方法 。 对 于 更 加 精致 的 黑白 照片 ， 每 个 像素 由 一 组 位 〈 通 常 是 8 个 ) 表示 ， 这 就 使 得 许 
多 灰色 阴影 可 以 表示 出 来 。 

就 彩色 图 像 而 言 ， 每 个 像素 通过 更 为 复杂 的 系统 来 编码 。 有 两 种 方法 很 常用 ， 我 们 称 其 中 
一 种 为 RGB 编码 ， 每 个 像素 表示 为 3 种 颜色 成 分 一 一 红 、 绿 、 蓝 一 一 它们 分 别 对 应 于 光线 的 三 原 
色 。 一 个 字 节 通常 是 用 来 表示 每 一 个 颜色 成 分 的 亮度 。 因 此 ， 要 表示 原始 图 像 中 的 一 个 单独 像 
素 ， 就 需要 3 个 字 节 的 存储 空间 。 

一 个 较 常 用 的 可 以 替代 简单 RGB 编码 的 方法 是 采用 一 个 “亮度 ”成 分 和 两 个 颜色 成 分 。 这 
时 候 , “亮度 ”成 分 〈 称 为 像素 亮度 ) 基本 上 就 是 红 、 绿 、 蓝 部 分 的 总 和 。( 事 实 上 ， 它 是 像素 
中 自 光 的 数量 ， 但 是 现在 我 们 不 需要 考虑 这 些 细 节 。) 其 他 两 种 成 分 〈 称 为 蓝 色 度 和 红色 度 ) 分 
别 取 决 于 在 像素 中 所 计算 的 像素 亮度 以 及 蓝 或 红 光 数量 的 差别 。 这 3 个 成 分 合 起 来 就 包括 了 显示 
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像素 所 需 的 信息 。 

利用 亮度 和 色 度 成 分 进行 图 像 编 码 这 种 方 式 的 普及 源 自 于 彩色 电视 领域 ， 因为 这 种 方法 提 
供 了 可 以 同样 兼容 老式 黑白 电视 接收 器 的 彩色 图 像 编码 方 f。 的 确 ， 只 需要 对 彩色 图 像 的 之 和 度 
成 分 编码 就 可 以 制造 出 图 像 的 灰 度 形 去。 

位 图 技术 的 一 个 缺陷 在 村， 图 像 不 能 轻易 调节 到 任意 大 小 。 基 本 上 上 ， 增 大 图 像 的 唯一 的 途 
径 就 是 变 大 像素 ， 而 这 会 使 图 像 呈现 颗粒 状 。 (这 就 是 应 用 于 数码 相机 的 “数字 变焦 ” 技术， 与 
此 相对 的 “光学 变焦 ” 是 通过 调整 相机 镜头 实现 的 。) 

为 了 避免 缩放 问题 ， 表示 图 像 的 另 一 种 方法 就 是 把 图 像 表示 成 几何 结构 的 集合 《如 直线 和 
曲线 )， 这 些 几 何 结构 可 以 用 解析 几何 技术 来 编码 。 这 种 描述 允许 最 终 显 示 图 像 的 设备 决定 几何 
结构 的 显示 方式 ， 而 不 是 让 设备 再 现 特殊 像素 模式 。 这 种 方法 被 用 在 当今 的 字 处 理 系 统 中 ， 产 
生 可 缩放 的 字体 。 例 如 ，TrueIype (由 微软 和 蔷 果 开发 ) 是 用 几何 结构 描述 文本 符号 的 系统 ， 
而 PostScript 〔〈 由 Adobe 系 统 开发 ) 提供 了 -种 描述 字符 及 更 一 般 的 图 形 数据 的 方法 。 这 种 表示 
图 像 的 几何 方法 也 在 计算 机 辅助 设计 (computer-aided design，CAD) 系统 中 很 常见 ， 用 于 在 计 
筑 机 的 屏幕 上 显示 和 操纵 三 维 物体 的 绘制 。 

对 使 用 许多 绘图 软件 〈 如 微软 的 绘图 工具 ) 的 用 户 来 说 ， 用 几何 结构 表示 图 像 与 用 位 图 表 
示 图 像 之 间 的 区 别 是 明显 的 ， 这 些 绘图 软件 支持 用 户 绘制 的 图 中 包含 预先 设 定 的 形状 《如 和 矩形、 
棚 圆 形 、 基 本 线条 等 )。 用 户 仅 从 茉 单 中 选择 他 所 需 的 几何 形状 ， 然后 使 用 记 标 绘制 这 个 形状 。 
在 绘制 过 程 中 ， 软件 保存 了 所 画 形 状 的 几何 描述 。 当 鼠 标 给 出 方向 后 ， 内 部 的 几何 表示 就 被 修 
改 ， 再 转化 成 位 图 形式 显示 出 来 。 这 种 方法 方便 图 像 的 缩放 和 形状 的 改变 。 然 而 ， 一 且 绘 制 过 
程 完成 ， 就 会 去 除 基本 的 几何 斤 述 ， 仅 保存 位 图 ， 这 意味 着 再 做 其 他 修改 (不 是 沿 着 指定 的 轴 
重新 配置 或 旋转 ， 这 些 轴 在 位 图 中 是 容易 实现 的 ) 所 要 经 历 宛 长 的 一 个 像素 接 一 个 像素 的 修改 


1.4.4 声音 的 表示 


为 了 便于 计算 机 存储 和 操作 ， 对 音频 信息 进行 编码 的 最 常用 方法 古 ， 按 有 规律 的 时 间 问 陋 
采样 声波 的 振幅 ， 并 记录 所 得 到 的 数值 序列 。 例如 ， 序 列 0、1.5、2.0、1.5、2.0、3.0、4.0、3.0、 
0 可 以 表示 这 样 一 种 声 让 ， 即 它 的 振幅 先 增 大 ， 然 后 经 短暂 的 减 小 ， 再 回升 至 较 高 的 幅度 ， 接 着 
又 减 回 至 0〈 见 图 1-14)。 这 种 技术 采用 每 秒 8000 次 的 采样 频 座 ， 己 经 在 远程 语音 通信 中 使 用 了 
许多 年 。 通 信 一 端的 语音 编码 为 数字 值 ， 表示 每 秒 8000 次 的 声音 振幅 。 这 些 数 值 接着 通过 通信 
线路 传输 到 接收 端 ， 用 来 重 现 声音 。 


编码 的 声 该 









0 1.5 . 1.8 2 号 .0 术 . 3. 0 


振幅 
图 1-14 ”序列 0、1.5、2.0、1.5、2.0、3.0、4.0、 了 0、 0 所 表示 的 声波 
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尽管 每 秒 8000 次 的 采样 频率 似乎 是 很 快 的 速率 ， 但 它 还 是 满足 不 了 音乐 录制 的 高 保 真 。 为 


了 实现 今天 音乐 CD 那样 的 重 现 声 音质 量 ， 我 们 需要 采用 每 秒 44 100 次 的 采样 频率 。 每 次 及 梓 得 
到 的 数据 以 16 位 的 形式 表示 出 来 (32 位 是 用 于 立体 声 录 制 的 )。 因 此 ， 录 制 成 立体 声 的 每 一 秒 音 
乐 需 要 100 多 万 个 仓储 位 。 


器 ， 


乐器 数字 化 接口 〈 简 称 MIDI)， 是 另外 一 种 编码 系统 。 它 广泛 应 用 于 电子 键盘 的 音乐 合成 
用 来 制作 视频 游戏 的 声音 以 及 网 站 的 辅助 音效 。MIDI 是 在 合成 器 上 编码 产生 音乐 的 指令 ， 


而 不 是 对 音乐 本 身 进行 编码 , 因此 它 避 免 了 采样 技术 那样 的 大 存储 容量 要 求 。 更 精确 地 说 , MIDI 
是 对 什么 乐器 演奏 什么 音符 以 及 多 长 时 间 进 行 编码 ， 例 如 ， 单 自 管 沉 春 D 音 符 2 秒 钟 ， 可 以 
编码 为 3 个 字 节 ,这 种 编码 方法 比 按照 每 秒 44 100 次 的 采样 频率 需要 两 百 多 万 个 二 进 制 位 来 编码 
要 好 。 


简 言 之 ，MIDI 可 以 看 作 是 编码 演奏 者 乐谱 的 一 种 方法 ， 而 不 是 演奏 本 身 。 因 此 ，MIDI “ 孙 


制 ” 的 音乐 在 不 同 的 合成 器 上 演奏 时 声音 可 能 是 截然 不 同 的 。 


间 题 与 练习 


1. 


上 


| 


En 


| 


本 


9. 


下 面 是 ASCI 编 码 的 -一 条 消息 ， 每 个 符号 8 位 。 它 的 含义 是 什么 ?【( 见 附 隶 A。》 
D1000011 DioOlLlL 0l101t101 DLLIOOO0U DlltubOlolL 了 于 工作 工 已 蝇 
ntto0lol Dit1l10010 00100000 DOLDOlOOlLL DLLoOoolL 1101001 
0l100107 01101110 DOL100011 0100101 


. 在 ASCII 码 中 ， 大 写字 母 码 和 相应 小 写字 母 码 之 间 的 关系 是 什么 2? 〈 见 附录 A。) 
. 用 ASCI 编 码 这 些 语句 ; 


a. Where are yoOU: 
b.“How7? Cheryl asked. 
fc. 2 一 5. 


. 描述 一 种 在 日 常生 活 中 能 够 呈现 两 种 状态 的 设备 ， 例 如 旗杆 上 的 旗帜 ， 或 者 升 起 或 者 下 降 。 赋 全 1 给 


一 种 状态 ， 另 一 种 为 0。 然 后 让 我 们 看 一 下 ， 当 以 这 样 的 位 来 存储 时 ， 字 母 b 的 ASCIH 码 会 皮 样 表示 ? 


. 将 下 列 二 进 制 表示 分 别 转化 为 相应 的 十 进 制 形式 。 


下 日 二 避 工 bb. 1001 C. 日 1 
UL DT1L10 人 ,二 口 总 避 如 { LU0010 
. 将 下 列 的 十 进 制 表示 分 别 转化 为 相应 的 二 进 制 形 陈 。 
中 掉 b, 13 C. 】 工 
出 .TS 心 . 必 了 ff 才 


. 如 果 每 个 数字 采用 每 字 节 一 个 ASCH 码 的 模式 编码 ， 那 么 3 个 字 节 可 以 表示 的 最 大 的 数字 值 是 才 少 ? 


如 果 采 用 二 进 制 编码 ， 那 么 又 能 够 表示 多 大 的 数字 值 ? 


. 除 十 六 进 制 以 外 ， 另 一 种 表示 位 模式 的 方法 是 点 分 十 进 制 记 数 法 〈dotted decimal notation) ， 落 中 的 


每 个 字 节 是 由 相对 应 的 十 进 制 数 来 表示 的 。 而 且 ， 这 些 字 节 者 示 用 何 点 分 开 s 例 如 25 表 十 
0000110000000101 模式 《12 雪 示 00001100 字 节 ，5 雪 示 00000101 字 节 了 而 3667 雪 示 
100010000001000000000111 模 式 。 用 点 分 十 进 制 记 数 法 表示 下 列 位 模式 ; 

a.0000111100001111 b.001100110000000010000000 

c.0000101010100000 

相对 于 位 图 技术 ， 用 矢量 技术 表示 图 像 有 哪些 优点 ? 位 图 技术 相对 于 矢量 技术 又 有 思 些 优点 有 


10. 假 如 采用 文中 所 讨论 的 每 秒 44 100 次 的 采样 频率 ， 给 立体 声 录音 的 ! 小 时 音乐 编码 。 请 问 这 段 音乐 编码 


的 大 小 与 CD 的 存储 容量 相 比 结果 如 何 ? 
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*1.5 “二进制 系统 


在 1.4 节 中 我 们 看 到 ， 二 进 制 记 数 法 是 表示 数字 值 的 一 种 方法 ， 仅 仅 利用 数字 0 和 1; 不 同村 
普遍 采用 的 十 进 制 记 数 系统 ， 十 进 制 系统 是 利用 数字 0 到 9。 现 在 我 们 要 比较 深入 地 研究 一 下 二 
进 制 记 数 法 。 

1.5.1 二进制 记 数 法 


回顾 十 进 制 系统 ,每 一 个 位 置 的 表示 都 与 一 个 量 值 相关 联 。 在 375 的 表示 中 ，5 的 位置 与 量 1 
相关 联 ，7 与 量 10 相 关联 ，3 与 量 100 相 关联 ( 见 图 1-15a)。 每 一 个 量 值 是 它 右 边 量 值 的 十 倍 。 整 
个 表达 式 代 表 的 数值 是 ， 每 一 个 数字 值 与 其 位 置 的 量 值 相 乘 所 得 积 之 和 。 举 例 说 明 : 模 却 375 
表示 (3X100) + (7X10) +〈5X1)， 用 更 加 技术 性 的 表示 法 即 (3X102)》 +《〈7X101) +《〈5 
X 1050)。 


可 EEE 六 表示 计 后 IE 上 表示 


1Dn 


到 目下 -一 四 十 EST 引 『 了] 
< 上 位 置 的 量 值 本 | 位 置 的 量 什 


(al 十 进 制 心 ) 二 进 制 
图 1-15 十进制 和 二 进 制 系统 


在 二 进 制 记 数 法 中 ， 每 个 数字 的 位 置 也 与 一 个 量 值 相关 联 ， 只 是 与 每 个 位 置 相 联系 的 那个 
量 值 是 它 右边 量 值 的 两 倍 。 更 精确 地 说 ， 二 进 制 表示 中 最 右边 的 数字 与 量 值 ] (2 ) 相关 联 ， 其 
无 边 的 下 一 个 位 置 与 量 值 2 (21) 相关 联 ， 下 一 个 与 量 值 4 (22) 相关 联 ， 再 下 一 个 与 量 值 8 2 
相关 联 ， 依 次 类 推 。 例 如 ， 在 二 进 制 表示 1011 中 ， 最 右边 1 的 位 置 与 量 值 1 相 关联 ， 接 下 来 一 个 1 
的 位 置 与 量 值 2 相 关联 ，0 的 位 置 与 量 值 4 相 关联 ， 最 右边 1 的 位 置 与 量 值 8 相 关联 ( 见 图 1-1Sb )。 

为 了 求 得 二 进 制 表示 所 表示 的 数值 ， 我 们 可 以 采取 和 十 进 制 相同 的 步骤 ， 即 先 求 得 每 个 数 
字 值 与 其 量 值 的 积 ， 再 计算 各 个 乘积 之 和 。 例 如 ，100101 表 示 的 数值 是 37， 如 图 1-16 所 示 。 需 
要 注意 的 是 ， 因 为 二 进 制 计数 法 仅 是 用 数字 0 和 1， 这 种 求 积 再 求 和 的 步骤 就 可 以 简化 为 求 数字 
值 为 1 的 位 置 对 应 的 量 值 的 和 。 因 此 ， 二 进 制 模式 1011 表 示 的 是 数值 11， 因 为 3 个 1 的 位 置 分 别 己 
量 值 1、2 以 及 8 相关 联 。 


进 制 模式 二 [mL ED 两 开 


上 FF 让 
证 中 
全 居 
上 和 
E 上 | 党 


的 信 位 置 的 量 倩 


图 1-16 二进制 表示 100101 的 解 倍 


在 1.4 节 中 ， 已 经 学 习 了 如 何 用 二 进 制 记 数 法 计数 ， 这 就 使 得 我 们 可 以 对 小 整数 进行 编码 。 
为 了 求 得 大 数值 的 二 进 制 表示 ， 你 可 能 更 倾向 于 图 1-17 所 描述 的 算法 。 让 我 们 利用 这 个 算法 麻 
求 数值 13 的 二 进 制 表 示 〔 匈 图 1-18)。 首 先 ， 将 13 除 以 2， 得 到 商 数 6 和 余数 1。 因 为 这 个 商 不 是 0， 
步骤 2 告诉 我 们 还 要 在 商 数 (6) 的 基础 上 除 以 2， 得 到 新 的 商 数 3 和 余数 0。 最 新 的 商 数 仍然 不 为 
0， 所 以 再 除 以 2， 得 出 商 数 1 和 余数 1。 再 一 次 ， 将 最 新 的 商 数 除 以 2， 此 时 得 到 商 数 0 和 余 狐 1。 
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因为 现在 的 商 数 是 0， 我 们 进入 步骤 3， 从 余数 列 中 得 到 原 数 (13) 的 二 进 制 表示 1101。 


步骤 1 将 该 值 除 以 2， 记 生 余数。 


步骤 2: 只 要 所 得 的 商 不 是 零 ， 就 继续 将 最 新 的 商 除 以 2， 并 记 下 余数 。 
步骤 3; 商 为 0 时 ， 将 余数 按 所 记录 的 顺序 从 右 到 左 依次 排列 ， 即 得 到 原 数 的 二 进 制 表示 。 





图 1-17 求 正 整数 二 进 制 表 示 的 算法 


0 1 
2/ 玉 人 


二 进 制 表 示 
iD 


图 1-1I8 利用 图 1-17 的 算法 求 13 的 二 进 制 表示 


1.5.2 “二进制 加 法 


为 了 理解 两 个 用 二 进 制 表示 的 整数 的 相 加 过 程 ， 首 先 让 我 们 回顾 一 下 用 传统 十 进 制 表示 的 
数值 的 相 加 过 程 。 例 如 ， 考 虑 下 列 的 问题 : 


5 此 
十 也 了 


我 们 先 对 节 右 列 的 8 和 7 相 加 ， 得 到 和 为 15， 我 们 把 $ 记 录 在 这 一 列 的 底部 ， 进 位 1 放 到 下 一 列 中 ， 
得 到 ， 

1 

58 

+27 

5 
现在 我 们 把 下 一 列 的 3 和 2 相 加 ， 并 加 上 进位 到 这 一 列 的 1， 得 到 的 和 为 8， 我 们 把 8 记录 在 这 一 列 
的 底部 ， 得 到 : 


己 昌 
十 迪 /7 
间 > 


加 之 ， 这 个 过 程 就 是 从 右 到 左 相 加 每 一 列 中 的 数字 ， 把 和 中 的 零头 数字 写 在 列 的 底部 ， 把 和 的 
大 数 〔〈 加 果 有 ) 进 到 下 一 列 。 

为 了 相 加 两 个 用 二 进 制 表示 的 正 整 数 ， 我 们 遵照 相同 的 过 程 ， 只 是 所 有 的 和 的 计算 使 用 图 
1-19 中 显示 的 加 法 规则 ， 而 不 是 你 在 小 学 所 学 的 传统 的 以 10 为 基 的 加 法 规则 。 例 如 ， 为 了 解决 
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问题 
工 工 工 吕 工 吕 
土 11011 
首先 相 加 最 右边 的 0 和 1， 得 到 1， 写 于 该 列 。 接 着 相 加 下 一 列 的 1 和 1， 得 到 10。 把 其 中 的 0 写 于 
该 列 下 ， 并 将 1 记 在 了 下 一 列 的 上 面 。 这 时 ， 加 法 如 下 ; 


] 
111010 


+ 1]1J1011 
bb 


相 加 下 一 列 的 1、0 和 0， 得 到 1， 将 1 写 于 该 列 下 。 下 一 列 的 1 和 1 总 和 为 10， 将 0 写 于 该 列 下 ， 并 
将 1 记 于 下 一 列 。 这 时 ， 加 法 如 下 : 


] 
111010 


01L0L 
下 一 列 的 1、1 和 1 总 和 为 11 (数值 3 的 二 进 制 符号 )， 将 低位 1 写 于 该 列 ， 并 将 另外 一 个 1 写 在 了 下 
一 列 的 上 面 。 把 那个 ! 与 那 列 原本 的 1 相 加 ， 得 到 10。 再 一 次 ， 在 该 列 写 下 低位 0， 并 将 1 写 在 了 
下 一 列 。 现在 得 到 


| 
1110210 
十 


010101 
下 一 列 的 唯一 项 藉 是 1， 是 上 一 列 进 过 来 的 。 所 以 我 们 将 其 记录 为 答案 。 最 终 的 结果 是 : 


1 1010 
| 
1010101 


图 1-19 二进制 加 壬 法 则 
1.5.3 二进制 中 的 小 数 


为 了 入 展 二 进 制 记 数 法 ， 使 其 包含 小 数 数 值 ， 我 们 使 用 了 小 数 点 〈radix point)， 其 功能 与 
十 进 制 符号 中 的 十 进 制 小 数 点 是 相同 的 。 也 就 是 说 ， 小 数 点 左边 的 数字 代表 整数 部 分 〈 整 个 部 
分 ) 的 数值 ， 如 同 前 面 讨 论 的 二 进 制 系统 那样 解释 ， 而 小 数 点 右边 的 数字 则 代表 数值 的 小 数 部 
分 ， 解 释 类 人 羽 其 他 二 进 制 位 ， 只 是 它们 的 位 置 被 赋予 了 小 数 的 量 值 。 也 就 是 说 ， 小 数 点 右边 第 
一 位 的 量 值 是 2 (2 )， 下 一 位 的 量 值 是 14 〈2-)， 再 下 一 位 是 118〈2-3)， 依 次 类 推 。 需 要 注 
意 的 是 ， 这 仅仅 是 前 面 所 述 规则 的 延续 ， 即 每 位 所 赋予 的 量 值 是 它 右边 大 小 的 两 倍 。 利 用 这 些 
赋 耶 二 进 制 位 位 置 的 量 值 ， 对 包含 小 数 点 和 不 包括 小 数 点 的 二 进 制 表 示 进 行 解码 的 步骤 基本 是 
相同 的 。 更 精确 地 说 ， 我 们 把 表示 中 每 一 个 位 值 与 其 对 应 位 位 置 的 量 值 相 匀 。 举 例 说 明 ， 二 进 


制 记 数 法 表示 的 101.101， 将 其 解码 可 得 5 ， 见 图 1-20。 
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二 进 制 模式 十 遇 品 j 司 站 攻 

1 工 其 1 

B X 霹 

1 X 拆 
1 X1 
避 大 
1 尖 卉 
2 时 二 5 性 和 
位 的 值 位 置 的 量 值 


图 1-20 ”二进制 表示 101.101 的 解码 


应 用 于 十 进 制 系统 里 的 加 法 技术 同样 适用 于 二 进 制 系统 。 也 就 是 说 ， 对 两 个 有 小 数 点 的 二 
进 制 表示 的 数 进 行 相 加 ， 我 们 只 是 需要 排列 小 数 点 ， 然 后 像 从 前 一 样 应 用 相同 的 加 法 步骤 。 例 
如 ，10.011 加 100.11 得 111.001， 如 下 所 示 ， 


上 业 持 
涩 品 壹 


10.011 
+ 100 110 
111 .局 口 1 
问题 与 练习 
1. 将 下 列 每 个 二 进 制 表示 转换 为 相应 的 十 进 制 形式 。 
及。】 总 二 总 工 总 btooo01l C. 了 并 dd. 110 | 
2. 将 下 列 每 个 十 进 制 表示 转换 为 相应 的 二 进 制 形式 。 
a. 32 b. 64 C. DG6 中 15 ,27 
3. 将 下 列 每 个 二 进 制 表示 转换 为 相应 的 十 进 制 形式 。 
息 . 1 。 遇 二 .101L1.111 人 .二 . 工 中 . 开间 .0 二 ] 是 国 | 
4, 用 二 进 制 记 数 法 表示 下 列 数值 。 
a 4 D. 之 人 人 e 5 上 
了 吕 16 106 
5. 按照 二 进 制 记 数 法 做 下 列 加 法 。 
生 ， 1 已 守 芋 b， 1010 .001 CC， 十 了 了 了 并 二 证 村 放生 
叶 遇 品 士 LT 十 遇 总 总】 十 遇 电 避 ] 
1.6 ”整数 存储 





数学 家 们 长 久 以 来 就 对 数字 记 数 系统 很 感 兴趣 ， 而 且 他 们 的 许多 想法 已 经 证 明 与 数字 电路 
的 设计 是 相符 的 。 本 节 ， 我 们 将 研究 其 中 两 种 记 数 系统 ， 二 进 制 补 码 记 数 法 和 佘 码 记 数 法 。 它 
们 痢 用 于 在 计算 设备 中 表示 整数 。 这 些 系 统 都 是 基于 二 进 制 系统 的 ， 但 是 具有 附加 的 特性 ， 因 
而 与 计算 机 设计 更 加 匹配 。 尽 管 有 这 人 么 多 的 优点 ， 它 们 还 是 有 缺陷 的 。 我 们 的 目标 是 了 解 这 些 
特性 以 及 它们 是 如 何 影响 计算 机 用 法 的 。 


模拟 与 数字 


在 21 世 纪 之 前 ， 许 多 研究 人 员 都 在 讨论 数字 和 模拟 技术 的 优 缺点 。 在 一 不 魏 往 孙 斌 汪 。 
数值 编码 成 一 系列 数字 ， 并 存储 在 若干 存储 单元 中 ， 每 个 单元 表示 一 个 数字 。 在 一 个 模拟 系 
统 里 ， 每 个 数值 存储 在 单独 的 一 个 存储 单元 里 ， 它 在 一 个 连续 的 范围 内 可 以 表示 任何 数 情 : 

让 我 们 利用 水 桶 作为 存储 器 来 比较 这 两 种 方法 。 为 了 模仿 一 个 数字 系统 ， 我 们 让 二 个 室 
桶 表示 数字 0 ， 一 个 满 桶 表示 数字 1 。 然 后 ， 我 们 就 可 以 利用 浮 点 记 数 法 ( 见 1.7 节 ) 用 一 排 
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水 桶 仓储 一 个 数字 值 。 相 反 ， 为 了 表示 模拟 系统 ， 我 们 用 水 桶 表示 数值 ， 其 水 位 表示 要 表示 
的 数字 值 。 年 一 看 ， 模 拟 系统 看 起 来 更 精确 ， 因 为 它 不 会 有 数字 系统 中 的 截断 误差 (再见 1.7 
节 ) 不 过 ， 在 模拟 系统 中 ， 水 桶 的 任何 移动 都 会 使 水 位 检测 出 错 ， 而 在 数字 系统 中 ， 没有 剧 
和 忽 的 哆 动 是 不 会 区 分 不 出 水 桶 有 水 没 水 的 。 因 此 ， 数 字 系统 不 像 模 拟 系统 那样 对 错误 敏感 
由 于 数字 系统 的 这 种 健壮 性 ， 许 多 原来 基于 模拟 技术 的 应 用 (例如 电话 通信 、 视 频 录 制 和 电 
了 现 ) 都 转 而 使 用 数字 技术 。 


1.6.1 ”二进制 补 码 记 数 法 


今天 计算 机 表示 整数 最 普遍 的 系统 就 是 二 进 制 梓 码 (twoss complement) 记 数 法 。 这 个 系统 
采用 固定 数目 的 二 进 制 位 来 表示 系统 中 的 每 一 个 数值 。 在 今天 的 设备 中 ， 应 用 二 进 制 补 码 系统 
征 很 交 所 的 ， 每 个 数值 用 一 个 32 位 的 模式 表示 。 这 种 大 系统 方便 表示 很 大 范围 的 数字 ， 但 相对 
寺 教 学 则 不 是 很 便利 。 因 此 ， 学 习 二 进 制 补 码 系统 的 特性 ， 我 们 将 集中 在 比较 小 的 系统 上 。 
图 1-21 列 出 了 两 种 二 进 制 补 码 系统 一 一 一 种 是 基于 长 度 为 3 的 位 模式 ， 男 一 种 是 基于 长 度 为 
4 的 位 模式 。 这 种 系统 是 这 样 构成 的 ， 即 先 规定 适当 长 度 的 一 组 二 进 制 0， 接着 用 二 进 制 计数 ， 
直到 只 有 一 个 0， 其 他 都 是 1 的 模式 形成 。 这 些 模式 表示 数值 0 1 2 3,…。 衣 示 负 值 的 模式 是 这 
伞 获 得 的 ， 即 先 规定 一 组 适当 长 度 的 二 进 制 1， 接 着 按照 二 进 制 反 向 计数 ， 直到 只 有 一 个 1， 其 
他 都 是 0 的 模式 形成 。 这 些 模式 表示 数值 -1，-2，-3.…。 《如 果 你 认为 利用 二 进 制 反 向 计数 有 轩 
难 ， 那 么 可 以 仅 从 表格 底部 ， 即 只 有 一 个 1， 其 他 都 为 0 的 模式 开始 ， 计数 到 全 是 1 的 模式 。) 


己 模式 所 表示 的 俏 


011li 7 

吕 1 1 6 

0101 5 

0100 4 

0011 3 

0010 2 

位 模式 所 表示 的 值 0001 1 
0000 0 

+ 项 ] 3 TI 一 

0310 2 1110 2 

001 ] 1101 二 

000 ， 1100 一 

111 二 i011 与 

1 一 了 1010 -总 

101 了 1001 了 

If00 -和 1000 > 

(al) 使 用 长 度 为 3 的 位 模式 (b) 使 用 长 度 为 4 的 位 模式 


图 1-21 二 进 制 补 码 记 数 法 系统 


注意 ， 在 二 进 制 补 码 系统 中 ， 位 模式 最 左边 的 二 进 制 位 指明 所 表示 数值 的 符号 。 因 此 ， 最 
顽 这 的 位 常 称 为 符号 位 〈sign bit)。 在 二 进 制 补 码 系统 中 ， 香 号 位 为 1 的 模式 表示 负 值 ， 符 号 位 
为 0 的 模式 表示 非 负 值 。 
在 二 进 制 补 码 系统 中 ， 绝 对 值 相同 的 正 负数 值 之 间 的 模式 很 相近 ， 从 右 向 堪 读 时 ， 交 到 第 
一 个 二 进 制 1， 它 们 都 是 相同 的 。 然 后 ， 以 这 个 1 为 分 界线 ， 左 面 的 位 模式 互 为 补 码 。(- -个 模式 
的 补 码 (complement) 是 通过 转换 所 有 的 二 进 制 0 为 1, 和 转换 所 有 的 二 进 制 1 为 0 而 得 到 的 模式 ,) 
例如 ， 图 1-21 中 的 4 位 系统 ， 表 示 2 和 -2 的 模式 都 是 以 10 结 束 ， 但 是 表示 2 的 模式 开始 为 00， 而 才 
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未 -2 的 模式 开始 为 11。 观 察 到 这 一 点 ， 我 们 就 可 以 得 出 在 绝对 值 相同 的 、 表示 正 负 值 的 位 模式 
之 间 转 换 的 算法 。 我 们 只 需要 从 右 到 左 复制 原始 的 模式 ， 直 到 第 一 个 1， 接着 ， 当 剩余 位 转移 到 
最 后 一 个 位 模式 时 ， 我 们 要 补 码 这 些 剩 余 位 〈 图 1-22)。 

用 十 位 二 进 制 补 -0 1 0 
码 记 数 法 表示 6 


从 右 到 左 复制 位 直 
到 一 个 1 被 复制 


一 一 一 一 一 一 








| 

】 

| 

| 

| 

‖ 

| 

] 
| 
1 

| 

有 

余下 的 位 取 反 
| 


E 本 
4 必 二 进 制 补 码 
记 数 法 表示 -6 LL 0 
图 1-22 利用 二 进 制 补 码 记 数 法 用 4 个 位 编码 数值 6 


理解 了 这 些 二 进 制 补 码 系统 的 基本 特性 ， 也 可 以 得 出 一 个 二 进 制 补 码 表 示 法 的 解码 算法 。 
如 果 要 解码 的 模式 有 一 个 符号 位 0， 我 们 仅仅 需要 读 出 这 个 数值 ， 束 好 像 这 个 模式 是 一 个 二 进 制 
雪 示 。 例 如 ，0110 表 示 数 值 6， 因 为 110 是 6 的 二 进 制 表示 。 如 果 要 编码 的 模式 有 一 个 符号 位 1， 
了 台 知 道 表示 的 数值 是 负 的 ， 而 我 们 所 要 做 的 就 是 找到 其 绝对 值 。 为 了 实现 这 个 目的 ， 我 们 先 要 
利用 图 1-22 中 “复制 及 补 码 ”步骤 ， 然 后 对 获得 的 模式 进行 解码 ， 了 就 仿佛 它 只 是 一 个 简单 的 二 
进 制 表 示 。 例 如 ， 为 了 解码 模式 1010， 首 先 我 们 意识 到 ， 因为 这 个 符号 位 是 1， 表 示 的 数值 就 是 
负 的 。 因 此 ， 我 们 利用 “复制 及 补 码 ” 步 双 实 现 了 模式 0110， 认识 到 这 是 6 的 二 进 制 表示 ， 然 后 
得 出 结论 ;原始 的 模式 表示 -6。 

1. 二 进 制 补 码 记 数 法 中 的 加 法 

我 们 采用 和 二 进 制 加 法 中 使 用 的 相同 算法 来 进行 二 进 制 补 码 记 数 法 中 的 数值 相 加 ， 只 是 ， 
包括 答案 的 所 有 位 模式 长 度 都 相同 。 这 就 意味 着 ， 企 二 进 制 补 码 系 统 的 加 法 中 ， 由 于 最 后 一 个 
进位 , 答案 左边 产生 的 任何 一 个 附加 位 都 要 删除 。 因 此 ， “加 法 运算 ”0101 和 0010 得 出 0111, 0111 
和 1011 得 出 0010 (0111+1011=10010， 缩 减 为 0010)。 

恨 据 这 个 理解 ， 我 们 来 分 析 一 下 图 1-23 中 的 3 个 加 法 问题 。 每 一 个 情况 ， 我 们 都 把 问题 转化 
为 二 进 制 补 码 记 数 法 〈 采 用 长 度 为 4 的 位 模式 )， 演示 先前 描述 过 的 加 法 过 程 ， 然 后 对 结果 进行 
解码 ， 回 到 一 般 的 十 进 制 记 数 法 。 

上 进 制 问题 - 进 制 补 码 问题 十进制 答 案 
心口 工 主 


十 自 总 工 心 
必 工 心 也 一 二 


区 1101 
ws -人 +1110 
本 工 心 工 工 一 一 一 5 


? 91I1 
品 只 站 了 性 工 
3 性 心 工作 一 -一生 之 


图 1-23 ”转换 为 二 进 制 补 码 记 数 法 的 加 法 问题 


注意 ， 图 1-23 的 第 3 个 问题 涉及 正 值 和 负 值 的 加 法 ， 它 展示 了 二 进 制 补 码 记 数 法 的 一 个 主要 
名 点 任何 带 符号 数字 组 合 的 加 法 都 可 以 利用 相同 的 算法 ， 于 是 也 就 可 以 用 相同 的 电路 。 这 占 
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人 们 传统 的 计算 法 则 是 截然 相反 的 。 尽 管 小 学 生 先 学 加 法 ， 然后 是 减法 ， 但 是 应 用 二 进 制 补 码 
记 数 法 的 计算 机 只 需 知道 加 法 就 可 以 了 。 

例如 ， 减 法 问题 7-5 与 加 法 问题 7+〈-5) 是 一 样 的 。 因 此 ， 如 果 人 们 命令 计算 机 执行 7〈 存 
储 为 0111) 减 5 (存储 为 0101)， 那 么 它 首 先 要 转换 5 为 -5 表示 为 1011)， 然 后 执行 0111+1011 的 
加 法 过 程 ， 得 到 代表 数值 2 的 0010， 如 下 所 示 ， 


了 01L11 UL1l1l 
二 林 一 二 . 自 101 一 士 _1 
bb010 一 了 

因此 我 们 可 以 看 到 ， 当 二 进 制 补 码 记 数 法 用 于 表示 数字 值 时 ， 一 个 加 法 电路 与 一 个 取 负 电 
路 的 组 合 就 足以 解决 加 法 以 及 减法 的 问题 了 。( 这 些 电路 的 图 示 及 解释 详 见 附录 B。) 

2. 洪 出 问题 

我 们 在 前 面 的 例子 中 忽略 了 这 样 一 个 问题 ， 聊 是 在 任意 的 一 个 二 进 制 补 码 系统 中 ， 都 有 对 所 
表示 数值 大 小 的 限制 。 当 使 用 4 位 模式 二 进 制 补 码 时 ， 可 以 表示 的 最 大 正 整 数 是 7， 最 小 负 整 数 是 
-8。 万 其 是 ， 数 值 9 无 法 被 表示 出 来 ， 这 陨 意 味 着 我 们 不 能 指望 得 出 5+4 的 正确 答案 。 事实 上 ， 它 
的 结果 似乎 会 为 -7。 这 种 现象 称 为 省 出 〈overflow)， 也 束 是 说 ， 溢 出 指 的 是 这 样 一 个 问题 ， 即 计 
算得 出 的 数值 超出 了 可 以 表示 的 数值 范围 。 使 用 二 进 制 补 码 记 数 法 时 ， 了 阙 个 正 值 或 负 值 分 别 相 加 
孝 可 能 会 出 现 这 种 情况 。 无 论 哪 种 情况 ， 检查 答案 的 符号 位 就 可 以 发 现 溢 出 的 条 件 。 如 果 两 个 正 
值 相 加 的 结果 是 负 值 的 模式 ， 或 者 两 个 负 值 相 加 的 结果 似乎 为 正 ， 孝 么 吕 上 发生 了 溢出 的 问题 。 

当然 ， 使 用 二 进 制 补 码 系统 ， 大 多 数 计 算 机 的 位 模式 都 比例 子 中 的 长 ， 因而 可 以 进行 较 大 
数值 操作 ， 而 不 会 产生 溢出 。 今 天 ， 人 们 普通 使 用 二 进 制 补 码 记 数 法 的 32 位 模式 来 存储 数值 ， 
可 以 得 到 的 最 大 正 值 是 2 147 483 647 。 如 果 需 要 更 大 的 数值 ， 我 们 可 以 使 用 更 长 的 位 横 式 ， 或 
痢 改 变量 度 单位 。 例 如 ， 在 解答 一 个 问题 时 ， 用 类 斥 代 替 英 寸 ， 所 得 数值 变 小 了 ， 而 且 也 可 以 
达到 所 要 求 的 精确 度 。 

关键 问题 是 计算 机 会 制造 错误 。 因 此 ， 使 用 计算 机 的 人 一 定 要 意识 到 可 能 涉及 的 危险 。 其 
中 一 个 问题 就 是 ， 计算 机 程序 员 和 使 用 者 会 自满 而 导致 忽视 了 -个 事实 ， 印 小 数值 可 以 累加 成 
大 数值 。 例 如 ， 人 们 过 去 普遍 使 用 二 进 制 补 码 记 数 法 的 16 位 模式 表示 数值 ， 这 就 意味 着 ， 出 现 
大 于 或 等 于 25=32 768 的 数值 时 ， 就 会 产生 溢出 。 1989 年 9 月 19 日 ， 一 家 医院 多 年 来 运行 良好 的 
计算 机 出 现 了 故障 。 仔 细 检 查 后 发 现 ， 那天 距 1900 年 1 月 1 日 共 32 768 天 ， 而 计算 机 的 程序 正 是 基 
于 那个 起 始 日 期 开始 计算 日 期 的 。 因 此 ， 由 于 滋 出 原因 ， 1989 年 9 本 
月 19 日 的 日 期 产生 了 负 值 一 一 计算 机 程序 设计 时 没有 考虑 处 理 这 人 
种 现象 。 二 于 开交 


土 卫 总 也 
1.6.2” 余 码 记 数 法 0 


表示 整数 值 的 另外 一 种 方法 是 余 码 记 数 法 〈excess notation ) 了 
与 二 进 制 补 码 记 数 法 相同 ， 余 码 记 数 法 中 的 每 一 个 数值 都 表示 为 1000 
相同 长 度 的 位 模式 。 为 了 建立 一 个 余 码 系 统 ， 我 们 首先 选择 所 使 
时 的 模式 的 长 度 ， 然 后 根据 二 进 制 记 数 呈 现 的 顺序 写 下 那个 长 度 0101 
的 太 有 位 模式 。 接 着 我 们 发 现 ， 二 进 制 1 作为 其 最 高 位 的 第 一 个 模 。， am 
式 大 约 就 在 数列 的 中 间 。 我 们 用 这 个 模式 表示 0， 其 后 的 模式 就 分 0010 
别 用 于 表示 -1，-2，-3,…， 其 前 的 模式 分 别 用 于 表示 1, 2, 3,…。 使 和 
用 长 度 为 4 的 模式 产生 的 代码 见 图 1-24。 我 们 可 以 看 到 ， 模 式 1101 
表示 数值 S，0011 表 示 数 值 -<5。( 注 意 ， 余 码 系统 和 二 进 制 补 码 系统 图 1-24 余 8 代 码 转换 表 
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的 区 别 就 是 符号 位 相反 。) 


图 1-24 表 示 的 系统 称 为 余 8 记 数 法 。 为 了 了 解 其 由 来 ， 首 先 我 们 相让 由 大 汪 尖 间 
用 传统 二 进 制 系统 的 代码 翻译 每 一 个 模式 ， 然 后 将 其 与 余 码 记 数 法 
表示 的 数值 进行 比较 。 对 于 每 一 个 模式 ,你 会 发 现 二 进 制 解释 值 比 in : 
余 码 记 数 法 解释 值 都 要 大 8。 例 如 ， 模 式 1100 用 二 进 制 记 数 法 表示 101 
为 数值 12， 在 余 码 系统 中 则 表示 4，0000 用 二 进 制 记 数 法 表示 为 数 011 -1 
值 0， 但 是 在 余 码 系统 中 则 表示 为 -8。 与 此 类 似 ， 在 基于 长 度 为 5 010 
的 位 模式 的 余 码 系统 中 ， 模 式 10000 用 于 表示 0 而 不 是 通常 的 数值 000 -4 
16， 该 记 数 法 称 为 余 16 记 数 法 。 同 样 ， 你 可 以 证 明 3 位 余 码 系统 应 “图 1.25 ”使 用 长 度 为 3 的 位 模 
该 称 为 余 4 记 数 法 《〈 图 1.25)。 式 的 余 码 记 数 系统 
问题 与 练习 


1. 将 下 面 每 一 个 二 进 制 补 码 表 示 转 换 为 相应 的 十 进 制 形式 。 
a.00011  b.0il11 c1Il100 下 11010  e00000 工 10000 


2. 用 8 位 位 模式 将 下 列 每 一 个 十 进 制 表 示 转 换 为 相应 的 二 进 制 补 码 形式 。 
a_. 6 b. -6 c. -17 d. 13 e. -1 f0 

3. 假定 下 列 位 模式 表示 的 是 用 二 进 制 补 码 记 数 法 存储 的 数值 ， 求 出 每 一 个 值 的 负 值 的 二 进 制 补 码 表 示 。 
a. 00000001 b. 01010101 c. 11111100 
d. LT1+11110 e. 00000000 EL IT 人 


4. 假定 一 台 机 器 用 二 证 制 补 码 记 数 法 存储 数值 ， 如 果 机 器 分 别 采 用 下 列 长 度 的 位 模式 , 那么 可 以 存储 的 
最 大 数 和 最 小 数 和 分 别 是 什么 ? 
温 , 站 b. 6 ,名 


35. 在 下 列 问题 中 ， 每 个 位 模式 表示 一 个 用 二 进 制 补 码 存储 的 数值 。 请 执行 文中 所 述 的 加 法 过 程 ， 按 照 二 
进 制 补 码 记 数 法 求 出 它们 的 答案 。 并 将 问题 及 答案 转换 为 十 进 制 记 数 法 进行 验证 
a- 站 10T b， oll ec oloet 出 1t0 es 1010 

寺 身 品 ] 总 土 . 昌 电 呈 | 土 由 站 1 中 土 0011 二 UL 

6 计算 下 列 由 二 进 制 补 码 记 数 法 表示 的 问题 , 但 这 次 要 观察 溢出 问题 并 指出 哪个 答案 因 产生 溢出 而 不 
正确 ? 

且 . 号 U pb， .0301 100 革 1010 . 8111 
土 遇 吕 1 于 OA 土 _ 蝇 由] 

7. 将 下 列 问题 从 十 进 制 记 数 法 转换 为 长 度 为 4 的 位 模式 的 二 进 制 补 码 记 数 法 ， 然 后 将 每 二 个 问题 转换 成 
一 个 相应 的 加 法 问题 〈 因 为 计算 机 可 以 执行 ) ， 然 后 执行 加 法 。 将 求 得 的 答案 转换 为 十 进 制 记 数 法 以 
进行 验证 。 

3， 咎 bb 3 CC、 才 嵌 . 了 e。 二 
-CD -2 -6 (4) -5 


. 在 二 进 制 补 码 记 数 法 里 ， 一 个 正 数 和 一 个 负数 相 加 时 会 产生 洲 出 吗 ? 请 说 明理 南 。 
9. 将 下 面 每 一 个 余 8 码 表示 转换 相应 的 十 进 制 形式 〈 解 题 时 不 要 看 文中 的 表格 ) 。 
有 1 工 改 b. 6dil1 ec1000 d 册 0010 en0000 工 1001 
10. 将 下 列 的 每 一 个 十 进 制 表示 转换 为 相应 的 余 8 码 形式 〈 解 题 时 不 要 看 文中 的 表格 六 。 
8. 和 b. -5 C. 3 由. 站 尼 - 了 ft - 呈 
11.， 数值 9 可 以 用 余 8 记 数 法 表示 吗 ? 用 余 4 记 数 法 表示 6 呢 ? 请 说 明理 由 。 


已 
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不 同 于 整数 存储 , 对 于 包括 小 数 部 分 的 数值 , 我 们 不 仅 要 存储 代表 其 二 进 制 表示 的 模式 0 和 1， 
还 有 其 小 数 点 的 位 置 。 一 种 流行 的 方法 是 基于 科学 记 数 法 ， 称 为 浮 点 〈floating-point) 记 数 法 。 


1.7.1 浮上 点 记 数 法 


让 我 们 以 只 用 一 个 字 节 存储 的 例子 来 解释 浮 点 记 数 法 。 尽 管 计 算 机 通常 使 用 更 长 的 模式 ， 
这 种 8 位 格式 还 是 可 以 表示 实际 的 系统 ， 既 可 以 表示 重要 
的 概念 ， 又 避免 了 长 字 节 的 混 斋 。 人 可 十 位 的 位 轩 

首先 我 们 要 规定 这 个 字 节 的 高 位 端 为 符号 位 。 再 次 ， 和 
符号 位 中 的 二 进 制 0 代表 存储 的 数值 为 非 负 ，1 代 表 数 值 为 
负 。 接 着 ， 我 们 将 这 个 字 节 剩余 7 个 位 分 为 2 组 ， 或 称 其 为 
域 ， 指 数 域 (exponent field) 和 属 数 域 (mantissa field )。 符号 位 
我 们 规定 符号 位 下 面 的 3 个 位 为 指数 域 ， 余 下 的 4 个 位 为 尾 图 1.26“ 浮 点 记 数 法 成 分 
数 域 。 图 1-26 描 述 了 如 何 拆 分 字 节 。 

我 们 可 以 借助 下 面 的 例子 解释 这 些 域 的 含义 。 假 如 一 个 字 节 由 位 模式 01101011 组 成 。 利 用 
前 面 的 形式 分 析 这 个 模式 ， 可 以 看 出 ， 符 号 位 是 0， 指 数 是 110， 尾 数 是 1011。 为 了 解码 这 个 字 
节 ， 我 们 首先 要 求解 它 的 尾数 ， 并 在 它 的 左边 放置 一 个 小 数 点 ， 于 是 得 到 


.1011| 


接着 ， 我 们 求解 指数 域 (110) 的 内 容 ， 并 将 其 解释 为 一 个 用 3 位 余 码 方法 〈 见 图 1-25) 施 
储 的 整数 。 因 此 ， 我 们 所 举例 子 的 指数 域 模式 表示 正 数 2。 这 就 要 求 我 们 将 上 面 所 得 结果 的 小 数 
点 向 右 移 动 2 位 。( 负 指数 域 就 意味 着 向 左 移动 小 数 点 .) 因此 ， 我 们 可 以 得 到 


10 .11 





这 就 是 2 的 二 进 制 表 示 。 接 着 ， 我 们 看 到 例子 中 的 符号 位 是 0， 因 此 表示 的 数值 是 非 负 。 可 以 
得 出 结论 : 字 节 01101011 表 示 2 。 如 果 模 式 是 11101011 〈 除 了 符号 位 都 与 之 前 相同 )， 表 示 的 


数值 就 将 为 -2 
再 看 一 个 例子 ， 字 节 00111100。 求 尾数 后 得 到 
-并 昌 忆 

然后 将 小 数 点 向 左 移动 一 位 。 因 为 指数 域 (011) 表示 数值 -1， 因 此 得 到 
.01100 


这 表示 318。 因 为 原始 模式 中 的 符号 位 是 0， 所 以 存储 的 数值 是 非 负 。 我 们 得 出 结论 ,模式 00111100 
表示 3/8。 


用 浮 点 记 数 法 存储 数值 ， 我 们 要 颠倒 前 面 的 过 程 。 例 如 ， 为 了 编码 1= ， 我 们 首先 要 将 其 用 


二 进 制 记 数 法 表示 ， 得 到 1.001。 接 着 ， 我 们 要 从 左 到 右 的 将 其 位 模式 复制 到 尾数 域 ， 权 从 二 进 
制 表 示 的 最 左边 的 1 开始 。 此 时 ， 这 个 字 节 如 下 : 


二 二 二 
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我 们 现在 必须 要 项 充 指 数 域 。 为 了 达到 这 个 目的 ， 假 定 指数 域 的 左边 有 一 个 小 数 点 ， 然 后 
规定 位 的 数量 以 及 小 数 点 移动 的 方向 ， 以 此 得 到 原始 的 二 进 制 数字 。 我 们 在 例子 中 可 以 看 
到 ，.1001 的 小 数 点 要 向 右 移动 一 位 才能 得 到 1.001， 指 数 因此 为 正 ， 所 以 我 们 将 101〈 在 余 4 记 数 
法 中 表示 为 正 1， 见 图 1-25) 置 于 指数 域 。 最 后 ， 因 为 存储 的 数值 是 非 负 的 ， 我 们 用 0 填充 符号 
位 。 完 成 的 字 节 如 下 ; 


当 填 充 尾 数 域 时 ， 你 可 能 会 漏 掉 一 个 微妙 的 细节 ， 这 个 规则 是 从 左 至 右 复制 以 二 进 制 表示 
的 位 模式 ， 并 要 从 最 左边 的 1 开始 。 为 阐述 清楚 ， 让 我 们 考虑 一 下 存储 数值 38 的 过 程 ， 它 用 二 
进 制 记 数 法 表示 为 .011。 这 时 ， 其 尾数 为 

二 
而 不 会 是 

二 
这 是 因为 ,我们 是 从 最 左边 二 进 制 表示 的 1 开始 填充 尾数 域 。 遵 循 这 个 规则 的 表示 称 为 规范 化 形 
式 〈normalized form )。 

使 用 规范 化 形式 减少 了 同一 数值 多 种 表示 的 可 能 性 。 例 如 ，00111100 和 01000110 都 可 以 解 
码 成 8， 但 是 只 有 第 一 个 模式 才 是 规范 化 形式 。 遵 循 规 范 化 形式 也 意味 着 ， 所 有 非 0 数 值 的 表 
示 琅 会 有 一 个 以 1 开始 的 尾数 。 不 过 ， 数 值 0 是 一 个 特例 ， 它 的 浮 点 表示 就 是 全 部 为 0 的 位 模式 。 


1.7.2 ”截断 误差 
如 果 要 利用 1 字 节 肖 点 记 数 法 存储 数值 2 ， 那么 让 我 们 考虑 因此 会 出 现 的 恼人 的 问题 。 我 


们 下 先 用 二 进 制 写 2 ， 得 到 10.101。 但 是 ， 当 把 这 个 模式 复制 到 尾数 域 时 ， 我 们 就 用 尽 了 空间 ， 
最 右边 的 1〈 表 示 最 后 的 1/8) 因此 丢失 了 【图 1-27)。 如 果 现 在 忽视 这 个 问题 ， 继 续 填 充 指数 域 
和 符号 位 ， 那 么 我 们 最 后 得 到 的 位 模式 将 为 01101010， 它 表 示 的 是 2 ， 而 不 是 2 二 。 这 个 现象 


称 为 截断 误差 〈truncation ermor) 或 舍 入 误差 〈round-off error)。 这 就 意味 着 ， 由 于 尾数 域 空 间 
不 够 大 ， 存 储 的 部 分 数值 于 失 了 。 


2 原始 表示 
10.3101: 二 进 制 表示 


芋 :0 于 0 1 原始 位 模式 





图 1-27 ”数值 2 的 编码 过 程 
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使 用 较 长 的 尾数 域 可 以 减少 这 种 误差 的 发 生 。 事 实 上 ， 今 天 生产 的 大 多 数 计算 机 都 采用 32 
位 存储 浮 点 记 数 法 表示 的 数值 , 而 不 是 我 们 现在 所 采用 的 8 位 。 这 同时 使 得 指数 域 也 吏 长 。 不 过 ， 
即使 有 这 样 较 长 的 格式 ， 有 时 候 还 是 需要 更 加 的 精确 。 

另外 一 个 截断 误差 的 来 源 就 是 在 十 进 制 记 数 法 中 比较 常见 的 一 个 现象 , 即 无 穷 展 开 式 问题 ， 
例如 发 生 在 我 们 用 十 进 制 形式 表示 13 的 时 候 。 无 论 我 们 用 多 少 位 数字 ， 有 一 些 数 值 都 不 能 精确 
地 表示 出 来 。 传 统 的 十 进 制 记 数 法 与 二 进 制 记 数 法 区 别 在 于 ， 二 进 制 记 数 法 中 有 无 穷 展 开 式 的 
数值 多 于 十 进 制 。 例 如 ， 数 值 10 表 示 为 二 进 制 时 为 无 穷 展 开 式 。 想 象 一 下 ， 一 个 粗心 的 人 用 
浮 点 记 数 法 存储 和 处 理 美 元 与 美 分 时 会 产生 什么 样 的 问题 ? 尤其 是 ， 如 果 美 元 用 作 度 量 单位 ， 
那么 一 角 硬 币 就 不 能 精确 地 仓储 。 其 中 一 个 解决 方式 就 是 ， 以 分 为 单位 处 理 数据 ， 这 样 ， 所 有 
的 数值 就 都 是 整数 ， 都 可 以 用 诸如 二 进 制 补 码 这 样 的 方法 存储 。 

被 断 误 去 和 与 之 相关 的 问题 是 工作 在 数值 分 析 领 域 的 人 们 每 天 都 很 关注 的 问题 。 这 个 数学 
分 支 研 究 的 是 执行 大 规模 、 需 要 癌 精确 度 的 有 效 计 算 所 涉及 的 问题 。 

下 面 的 例子 可 以 激 起 任何 一 个 数值 分 析 家 的 兴趣 .假设 我 们 要 应 用 前 面 定 义 的 1 字 节 浮 点 记 
数 法 来 做 这 3 个 数值 的 加 法 : 


D 工 


如 果 我 们 按照 上 述 序列 相 加 数值 ， 首 先 就 是 2 加 上 = ， 得 到 23 ， 二 进 制 表示 为 10.101。 不 幸 


的 是 ， 因 为 这 个 数值 不 能 精确 地 存储 〈 如 同 前 面 所 看 到 的 )， 我 们 第 一 步 的 结果 最 后 存储 为 2 
(与 相 加 数值 中 的 一 个 相同 )。 下 -- 步 是 把 这 个 结果 再 加 到 最 后 的 /8 上。 截断 误差 在 这 里 再 一 次 
出 现 了 ， 最 后 的 结果 是 错误 的 2> 。 


现在 让 我 们 以 相反 的 顺序 相 加 这 些 数值 首先 将 了 加 到 = ， 得 到 二 ， 其 二 进 制 表示 为 .01， 
因此 ， 第 一 步 的 结果 在 一 个 字 节 里 存储 为 00111000， 这 是 精确 的 。 然 后 将 这 个 加 到 数列 中 的 


下 一 个 数值 2 ,得 到 2 了 ， 我 们 可 以 将 其 在 一 个 字 节 里 存储 为 01101011。 这 次 的 答案 是 正确 的 。 

总 而 言 之 ， 在 浮 点 记 数 法 表示 的 数字 值 加 法 中 ， 它 们 相 加 的 顺序 很 重要 。 问 题 是 ， 如 果 一 
个 大 数字 加 上 一 个 小 数字 ， 那 么 小 数字 就 可 能 被 截断 。 因 此 ， 多 个 数值 相 加 的 一 般 规 则 是 先 相 
加 小 数字 ， 这 是 为 了 它们 将 累计 成 一 个 大 数字 ， 加 到 更 大 的 数值 上 。 这 就 是 前 面 例子 中 反映 的 
现象 。 

今天 商用 软件 包 的 设计 师 们 已 经 做 到 ， 使 没有 经 过 培训 的 使 用 者 们 也 能 很 好 地 如 免 这 种 问 
题 的 发 生 。 在 一 个 典型 的 电子 制 表 软 件 系统 中 ， 除 非 相 加 的 各 个 数值 大 小 差别 达到 1016 或 更 多 ， 
否则 所 得 结果 都 是 正确 的 。 因 此 ， 如 果 你 认为 有 必要 对 数值 

1 DUOUUUOD DOD0O Don DO00 
加 1， 那 么 ， 你 会 得 到 答案 

1 UU0U Doob Dobobo Doo0 000 
而 不 是 

LuUU00 bu00，0b0b,000 ,001 
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这 样 的 问题 在 一 些 应 用 中 是 很 严重 的 《例如 航海 系统 )， 小 误差 可 能 在 加 法 运算 中 累加 ， 最 终 产 
生 严 重 的 后 果 。 但 是 ， 对 于 一 般 的 PC 使 用 者 ， 大 多 数 商 用 软件 提供 的 精确 度 已 经 足够 了 。 


问题 与 练习 
1. 用 文中 所 述 的 浮 点 格式 对 下 列 位 模式 进行 解码 。 
a.01001010 bn0l101101 c. 00111001L1 由 11011100 已. 荆门 了 门卫 六 1 
2 将 下 列 数值 编码 成 文中 所 述 的 浮 点 格式 。 指 出 截断 误 盖 的 出 现 情 况 。 
了 ] | 号 
三 = 已。 一- 2 二 
a 2 De Q. 已. 2 
3. 根据 文中 所 述 的 泽 点 格式 ， 模 式 01001001 和 00111101 中 哪 一 个 表示 的 值 齐 大 ? 后 述 一 种 简单 的 确定 
哪个 模式 表示 的 值 更 大 的 过 程 。 
4 使 用 文中 所 述 的 评点 格式 时 ， 可 以 表示 的 最 大 值 是 什 玄 ? 可 以 胡 示 的 最 小 正 值 是 什么 ? 


二 机 = 本 人 了 于 证 仙 RE 下 -六 本 下 TH re 1 1 HE -SET 二 二 于 HH 


1 和 ENH9 寺 人 
一 RE 人 和 


为 了 存储 和 传输 数据 ， 在 保留 原 有 内 容 的 条 件 下 ， 缩 小 所 涉及 数据 的 大 小 是 有 益 的 《有 时 
也 是 必需 的 )。 完 成 这 一 过 程 的 技术 称 为 数据 压缩 〈data compression)。 本 节 ， 我 们 首先 要 学 习 
靖 通 的 数据 压缩 方法 ， 然 后 了 解 一 些 为 特殊 应 用 设计 的 方法 。 


1.8.1 通用 的 数据 压缩 技术 


数据 压缩 方案 有 两 类 。 一 类 是 无 损 〈lossless) 的 ， 一 其 是 有 损 (lossy) 的 。 无 损 方案 在 压 
缩 过 程 中 是 不 丢失 信息 的 ， 有 损 方案 在 压缩 过 程 中 会 发 生 信 息 扩 上 失 。 通常 有 损 技 术 比 无 损 技 术 
提供 更 大 的 压缩 ， 因 此 在 可 以 忽略 小 错误 的 数据 压缩 中 应 用 很 广 ， 如 在 图 像 和 音频 压缩 中 。 

对 于 被 压缩 数据 由 一 长 串 相 同 的 数值 组 成 的 情况 ， 普 明 使 用 称 为 行程 长 度 编码 (run-length 
encoding) 的 压缩 技术 ， 这 是 一 种 无 损 方法 。 它 的 过 程 是 ， 将 一 组 相同 的 数据 成 分 替换 成 一 个 
代码 ， 指 出 重复 的 成 分 以 及 其 在 序列 中 出 现 的 次 数 。 例 如 ， 指出 一 个 位 模式 包括 253 个 1， 接 着 
118 个 0， 接 着 87 个 1， 这 要 比 实际 的 列 出 458 个 位 要 节省 空间 。 

细 外 一 个 无 损 数 据 压 缩 技术 是 频率 相关 编码 (frequency-dependent encoding)， 在 这 个 系统 
主 ， 用 于 表示 数据 项 目的 位 模式 长 度 与 这 个 项 目 使 用 频率 是 相反 的 。 这 些 代码 是 变 长 编码 的 例 
于， 意思 是 项 目 由 不 同 长 度 的 模式 表示 ， 而 不 是 像 Unicode 那 样 的 代码 ， 所 有 符号 都 是 由 16 个 位 
表示 。 戴 维 ' 赫 夫 曼 的 功劳 是 发 现 了 一 般 用 于 开发 频率 相关 代码 的 算法 ， 人 们 一 般 称 用 这 科 方 
法 开发 的 代码 为 赫 夫 曼 代 码 (Huffman code)。 因 此 ， 今天 使 用 的 大 多 数 频率 相关 代码 都 是 赫 夫 
曼 代码 。 

让 我 们 看 一 个 频率 相关 编码 的 例子 ， 考 虑 一 下 编码 英文 文本 的 任务 。 在 喘 文 中 ， 字 母 e、f 
a 和 i 使 用 频率 要 大 于 字母 ?>、q 和 x。 因 此 ， 当 为 英文 文本 建立 代码 时 ， 如 果 用 短 位 模式 表示 前 面 
的 字母 ， 长 位 模式 表示 后 面 的 字母 ， 坊 么 咒 会 节省 空间 。 结 果 得 到 这 样 一 个 代码 ， 其 对 英文 文 
本 的 表示 要 比 用 统一 代码 时 的 短 。 

在 茶 些 情况 下 ， 压 缩 的 数据 流 由 各 个 单元 组 成 ， 每 一 个 单元 与 其 前 面 一 个 差别 很 小 。 动 画 
的 连续 画面 就 是 一 个 例子 。 这 时 , 使 用 相对 编码 (relative encoding), 也 称 为 盖 分 编码 (differential 
encoding) 的 技术 ， 是 很 有 用 的 。 这 些 技 术 记 录 下 了 连续 数据 单元 之 间 的 区 别 ， 面 不 是 整个 单 
元; 也 了 吏 是 说 ， 每 个 单元 是 根据 其 与 前 一 个 单元 的 关系 编码 的 。 相对 编码 用 无 损 形 式 和 有 损 形 
式 都 可 以 完成 ， 取 次 于 连续 数据 单元 之 间 的 差别 是 精确 地 编码 还 是 近似 地 编码 。 
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还 有 其 他 流行 的 压缩 系统 ， 如 基于 字典 编码 (dictionary encoding) 技术 。 这 里 的 术语 字典 
(dictionary ) 指 的 是 一 组 构造 块 ， 压 缩 的 信息 通过 筷 们 建造 起 来 ， 而 信息 本 身 编码 成 一 系列 字典 
的 参照 符 。 我 们 一 般 认 为 字典 编码 系统 是 无 损 系 统 ， 不 过 在 图 像 压 缩 学 习 中 我 们 将 看 到 ， 有 时 
候 ， 字 典 条 目 仅 仅 是 正确 数据 成 分 的 近似 值 ， 这 就 使 其 成 了 有 损 压 迪 系 统 。 

字 处 理 系统 可 以 使 用 字典 编码 来 压缩 文本 文件 ， 因 为 为 了 拼写 检查 ， 一 些 字 典 已 经 包含 在 
这 些 字 处 理 系统 中 ， 它 们 是 很 出 色 的 压缩 字典 。 尤 其 是 ， 一 个 完整 的 单词 可 以 编码 成 字典 的 一 
个 单独 参考 符 ， 而 不 是 像 ASCI 和 Unicode 系 统 那样 编码 成 一 列 单独 的 符号 。 字 处 理 系统 中 的 一 
个 普通 字典 要 包括 大 概 25 000 个 条 目 ， 这 就 意味 着 ， 一 个 条 目 可 以 用 0 到 24 999 的 整数 识别 。 这 
就 是 说 ， 字 典 中 一 个 特定 条 目 用 15 位 的 模式 就 足 可 识别 。 相 反 ， 如 果 用 到 的 单词 包括 6 个 字母 ， 
它 的 各 个 符号 编码 在 7 位 ASCI 码 中 需要 42 位 ， 在 Unicode 中 需要 96 位 。 

字典 编码 的 一 个 变 体 是 自 适应 字典 编码 (adaptive dictionary encoding， 也 称 为 动态 字典 纲 
码 )。 在 自 适 应 字典 编码 系统 中 ， 编 码 过 程 中 字典 是 可 以 改变 的 。 一 个 流行 的 例子 是 LZW 
(Lemlel-Ziv-Welsh) 编码 〈 根 据 它 的 创造 者 Abraham Lempel、Jacob Ziv 和 Tery Welsh 的 姓氏 前 
令 )。 用 LZW 编 码 信息 ， 人 们 首先 用 包含 基础 构造 块 的 字典 ， 信 息 就 是 用 那些 构造 块 建 起 来 的 。 
但 是 ， 随 着 人 们 在 信息 中 发 现 更 大 单元 ， 它 们 就 被 加 到 了 字典 上 一 一 意思 是 ， 这 些 单元 未 来 的 
出 现 可 以 编码 为 一 个 而 不 是 多 个 的 字典 参照 符 。 例 如 ， 当 编码 英文 文本 时 ， 人 们 首先 要 用 字典 ， 
要 包含 单独 字符 、 数 字 和 标点 符号 。 但 是 ， 当 信息 中 的 单词 被 确认 后 ， 它 们 可 以 加 到 字典 中 。 
因此 ， 随 着 信息 的 编码 ， 字 典 会 扩展 ;而 随 着 字典 的 扩展 ， 信 息 中 更 多 的 单词 〈 或 少 是 单词 及 
复 的 模式 ) 就 可 以 编码 为 字典 的 一 个 参照 符 。 

结果 是 ， 信 息 用 一 部 相当 大 的 、 完 全 针对 本 信息 的 字典 编码 。 但 是 解码 这 条 信息 并 不 一 定 
需要 这 个 大 字典 。 只 需要 原始 的 小 字典 。 的 确 ， 解 码 过 程 可 以 与 编码 过 程 用 同一 个 小 字典 。 接 
着 ， 随 着 解码 进程 的 继续 ， 会 遇 到 编码 过 程 中 发 现 的 相同 的 单元 ， 因 此 可 以 将 它们 加 到 字典 中 ， 
作为 未 来 编码 过 程 的 参照 符 。 

举例 说 明 ， 考 虑 用 LZW 编 码 信息 

MYX XYWYXK ME MYVKX 
首先 用 一 个 有 3 个 条 目的 字典 ， 第 一 个 是 zx， 第 二 个 是 y， 第 三 个 是 空格 。 我 们 先 将 zx 编码 为 121， 
意思 是 这 个 信息 的 第 一 个 模式 包括 第 一 个 字典 条 目 ， 接 着 是 第 二 个 ， 然 后 又 是 第 一 个 。 接 者 空 
格 编码 为 1213。 但 是 因为 有 了 一 个 空格 ， 我 们 知道 前 面 的 字符 串 已 经 形成 了 一 个 单词 ， 所 以 我 
们 将 模式 zyx 加 到 字典 里 作为 第 四 个 条 目 。 依 此 类 推 ， 整 个 信息 就 编码 为 121343434。 

如 果 我 们 现在 要 求解 码 这 条 信息 ， 用 原始 的 3 条 目 字典 ， 我 们 将 首先 解码 起 始 的 1213 串 为 
xx， 接 下 来 是 空格 。 这 时 我 们 意识 到 ，xzx 串 形成 了 一 个 单词 ， 就 将 其 加 到 字典 中 作为 第 四 个 
条 目 ， 同 编码 的 过 程 中 所 做 的 一 样 。 我 们 接着 解码 这 个 信息 ， 发 现 信息 中 的 4 指 的 是 这 第 四 个 新 
条 目 ， 将 其 解码 为 单词 zz， 因此 产生 模式 


其 YY 
按 这 种 方法 ， 我 们 最 终 解 码 121343434 趾 为 
其 VX 了 YX YY 基 其 Y 天 


这 就 是 原始 信息 。 
1.8.2 ”图 像 压 纺 
在 1.4 节 中 ， 我 们 已 经 了 解 到 如 何 用 位 图 技术 编码 。 不 过 ， 得 到 的 位 图 通常 是 非常 大 的 。 因 
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此 ， 已 经 为 了 图 像 表 示 专 门 开 发 出 许多 压缩 方案 。 

一 种 称 为 GIFE〈 是 Graphic Interchange Format 的 缩写 ， 一 些 人 读 作 “Gift ”还 有 一 些 人 读 作 
“Jiff”) 的 系统 是 一 个 字典 编码 系统 ， 由 CompuServe 公 司 研制 开发 。 它 处 理 压缩 问题 的 方法 是 ， 
将 赋予 一 个 像素 颜色 的 数量 减少 到 只 有 256 人 个。 这些 颜色 的 每 一 个 红 -- 绿 - 蓝 组 合 都 用 3 个 字 节 编 
码 ， 这 256 个 编码 存储 在 一 个 称 为 调 色 板 的 表格 〈 一 个 字典 ) 里 。 图 像 中 的 每 个 像素 都 可 以 用 一 
个 字 节 表示 ， 它 的 数值 指出 在 256 个 调 色 条 目 中 哪 一 个 表示 像素 的 颜色 。( 回 顾 : 一 个 字 节 能 够 
包括 256 个 不 同位 模式 中 的 任意 一 个 。) 需要 注意 的 是 ，GIF 用 于 任意 图 像 时 都 是 有 损 压 缩 系 统 ， 
因为 调 色 板 中 的 颜色 不 可 能 与 原始 图 像 的 颜色 一 致 。 

通过 用 LZW 技 术 将 这 个 简单 的 宇 典 系统 扩展 为 目 适 应 字典 系统 ，GIF 可 以 进一步 压 迪 。 尤 
其 是 ， 随 着 在 编码 过 程 中 遇 到 像素 模式 ， 将 其 加 到 字典 中 ， 于 是 将 来 遇 到 这 些 模式 时 就 可 以 更 
加 高 效 地 编码 了 。 因 此 ， 最 终 的 字典 是 由 原始 调 色 板 和 一 组 像素 模 陈 构成 的 。 

GIF 调 色 板 中 某 一 个 疝 色 通 并 被 赋予 值 “透明 ”， 意 思 是 ， 背 景色 可 以 透 过 赋予 该 颜色 的 任 
何 一 个 区 域 而 表现 出 来 。 这 种 选择 与 GIF 系统 的 相对 简便 性 相 结合 ， 使 得 在 简单 动画 应 用 中 选 
择 GIF 是 一 个 合乎 逻辑 的 选择 ， 其 中 的 多 重 图 像 必 须 于 绕 计算 机 屏幕 旋转 。 另 一 方面 ， 它 只 能 
够 编码 256 种 颜色 ， 这 就 使 得 它 不 适合 需要 高 精确 度 的 应 用 ， 如 摄影 领域 。 

另外 一 种 流行 的 图 像 压 缩 系 统 是 JPEG ( 读 作 “JAY-peg”)。 它 是 由 ISO 中 的 联合 图 像 专 家 
组 (Joint Photographic Experts Group)《〈 标 准 因 此 得 名 ) 研制 开发 的 标准 。JPEG 已 经 被 证 实 是 压 
缩 图 像 的 一 种 有 效 的 标准 ， 并 广泛 用 于 摄影 业 ， 事 实 表 明 ， 大 多 数 的 数码 相机 都 是 采用 JPEG 作 
为 它们 默认 的 压缩 技术 。 

JPEG 标 准 实 际 上 包含 几 种 图 像 压 擅 的 方法 ， 每 种 都 有 它 目 己 的 目标 。 在 需要 绝对 精确 的 情 
况 下 ，JPEG 可 提供 无 损 模 式 。 不 过 ， 相 对 于 JPEG 的 其 他 模式 ，JPEG 的 无 损 模式 不 能 形成 高 级 
别 的 压缩 。 而 且 ，JPEG 的 其 他 选择 模式 已 经 很 成 功 ， 这 就 意味 着 人 们 很 少 使 用 其 无 损 模 式 。 相 
反 ， 称 为 JPEG 基 线 标准 的 选择 模式 〈( 也 称 为 JPEG 的 有 损 顺 序 模式 ) 已 经 成 为 许多 应 用 的 选择 标 
准 。 

使 用 JPEG 基 线 标准 的 图 像 压 缩 有 几 个 步骤 ， 有 一 些 是 利用 人 眼 的 局 限 性 设计 的 。 尤 其 是 ， 
相对 于 颜色 的 变化 ， 人 眼 对 亮度 的 变化 更 为 敏感 。 因 此 我 们 首先 看 一 幅 用 光照 和 色 度 编码 的 图 


像 。 第 一 步 ， 在 一 个 2X2 的 像素 方块 中 ， 求 色 度 的 平均 值 。 这 样 色 度 信息 的 大 小 减 小 为 一， 但 


还 保留 了 所 有 的 原始 亮度 信息 。 结 果 是 ， 在 没有 明显 的 图 像 质 量 损失 的 情况 下 获得 了 很 高 的 压 
缩 级 别 。 

下 一 步 是 ， 将 图 像 拆 分 成 8&X8 的 像素 块 ， 然 后 将 信息 压缩 进 每 一 个 块 ， 并 作为 一 个 单元 。 
这 是 通过 运用 一 种 称 为 离散 余弦 转换 的 数学 技术 实现 的 , 我 们 现在 不 需要 关心 这 个 转换 的 细节 。 
更 重要 的 是 ， 这 种 转换 将 原始 的 8X8 块 变 成 了 另外 一 种 块 ， 它 其 中 的 条 目 反 映 了 原始 块 中 的 像 
素 之 间 如 何 相互 联系 ， 而 并 不 是 与 实际 像素 值 。 在 这 个 块 里 ， 那 些 低 于 设 定 极限 的 数值 将 被 0 
替代 ， 反 映 的 是 ， 这 些 数 值 所 表示 出 的 变化 非常 小 ， 人 了 眼 无 法 觉察 。 例 如 ， 如 果 原 始 块 中 包含 
一 个 小 格子 的 模式 ， 那 么 新 的 块 就 可 能 表现 为 平均 色 。( 典 型 的 8 X 8 像素 块 能 够 表示 图 像 中 一 
个 非常 小 的 方块 ， 因 此 人 眼 根本 不 能 够 识别 小 格子 的 外 观 。) 

这 时 候 ， 更 传统 的 行程 编码 、 相 对 编码 以 及 变 长 编码 技术 被 用 于 获得 附加 的 压缩 。 总 之 ， 
JPEG 基 线 标准 一 般 将 彩色 图 像 讨 缩 至 少 10 倍 ， 有 时 甚至 要 30 倍 ， 而 疫 有 明显 的 质量 损失 。 

另外 一 个 图 像 数据 压缩 系统 是 TIFF 〈 是 Tagged Image File Format 的 缩写 )。 不 过 ，TIFF 最 普 
遍 的 应 用 不 是 数据 压缩 ， 而 是 存储 照片 的 一 个 标准 格式 ， 同 时 要 存储 上 相关 的 信息 ， 如 日 期 、 
时 间 以 及 相机 设置 。 这 时 候 ， 图 像 本 身 通 常 是 存储 为 没有 压缩 的 红 、 绿 和 蓝 像 素 成 分 。 
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TIFF 标 准 组 合 的 确 包含 数据 压缩 技术 ， 大 多 数 是 为 在 传真 应 用 中 压缩 文本 文档 的 图 像 设计 


中 的 彩色 图 像 压 缩 选 择 基于 类 似 于 GIF 所 使 用 的 技术 ， 因 此 并 没有 广泛 应 用 于 摄影 业 。 
1.8.3 ”音频 和 视频 压缩 


音频 及 视频 的 编码 和 压缩 最 常用 的 标准 是 由 ISO 领导 的 运动 图 像 专 家 组 《Motion Picture 


Experts Group，MPEG) 研制 开发 的 。 因 此 这 些 标准 称 为 MPEG。 


MPEG 包 含 许多 不 同 应 用 的 许多 标准 。 例 如 ， 高 清晰 电视 (HDTV ) 的 要 求 与 视频 会 议 的 就 


不 同 ， 视 频 会 议 中 ， 播 音信 号 必须 经 由 可 能 容量 有 限 的 传输 通道 。 而 且 ， 这 两 种 应 用 又 都 不 同 
于 存储 视频 ， 它 的 有 些 部 分 可 以 代 蔡 或 略 过 。 


MPEG 使 用 的 技术 已 经 超出 了 本 书 的 范围 。 但 是 一 般 说 来 ， 与 存储 动画 到 胶片 上 基本 相同 ， 


视频 压缩 技术 也 是 基于 构建 成 一 系列 图 片 的 视频 的 。 为 了 压缩 这 些 序 列 ， 只 有 一 部 分 图 片 ， 称 
为 ] 帧 〈Lframe)， 是 整个 编码 的 。 在 [ 帧 之 间 的 图 片 采 用 相对 编码 技术 。 也 就 是 说 ， 并 没有 编码 
下 个 图 片 ， 只 是 将 与 前 一 幅 图 不 同 的 地 方 编码 。I 帧 本 身 经 常 使 用 类 似 于 JPEG 的 技术 压缩 。 


压缩 音频 最 著名 的 系统 是 MP3， 它 是 在 MPEG 标 准 中 开发 出 来 的 。 事 实 上 ，MP3 是 MPEG 


layer3 的 缩写 。 联 合 其 他 压缩 技术 ，MP3 利 用 人 耳 的 特性 ， 即 删除 人 耳 觉察 不 到 的 细节 。 其 中 一 
个 特性 称 为 暂时 模糊 〈temporal masking)， 指 的 是 在 一 个 巨大 声响 后 ， 短 时 间 内 ， 人 耳 觉 察 不 
到 本 可 以 听见 的 轻柔 的 声音 。 另 一 个 称 为 频率 模糊 〈frequency masking)， 指 的 是 某 一 频率 的 声 
音 可 能 掩盖 相近 频率 的 轻柔 的 声音 。 利 用 这 些 特性 ，MP3 就 可 以 获得 视频 的 有 效 压 缩 ， 而 且 音 
质 接近 CD 。 


使 用 MPEG 和 MP3 压 缩 技术 ,摄影 机 用 128 MB 的 存储 空间 就 可 以 录制 长 达 1 小 时 的 视频 ， 而 


且 便 携 音乐 播放 器 在 1GB 里 就 可 以 存储 多 达 400 首 流行 歌曲 。 但 是 ,不同 于 其 他 压缩 目的 ， 音 频 

和 视频 的 压缩 不 需要 节省 存储 空间 。 另 外 一 个 同等 重要 的 目的 是 获得 编码 ， 它 们 使 得 信息 通过 

今天 的 通信 系统 能 得 到 及 时 的 传输 。 如 果 每 一 个 视频 镜头 需要 1MB 的 存储 空间 ， 而 且 传 播 镜头 

的 通信 路 径 每 秒 钟 只 能 传输 1 KB， 那 么 根本 无 法 实现 成 功 的 视频 会 议 。 因 此 ， 除 了 认可 的 复制 
质量 ， 音 频 和 视频 压缩 系统 的 鉴定 还 有 赖 于 实时 数据 传输 的 速率 。 这 些 速率 通 第 用 比特 / 秒 《hit 

per second，bits) 来 度量 。 基 本 的 单位 包括 Kbits (kilo-bps， 等 于 1000 bitys)，MDbit/s《mega-bps， 
等 于 106bits)，Gbit/s 〈giga-bps， 等 于 10?bits)。 使 用 MPEG 技 术 ， 视 频 展 示 可 以 通过 40Mbits 

的 传输 速率 成 功 传输 。MP3 录 制 需 要 的 传输 速率 一 般 不 超过 64 Kbits。 


问题 与 练习 


和 


[ 汪 


. 列 出 4 种 通用 的 压 彤 撤 林 。 


使 用 LZW 压 缩 ， 字 典 最 初 为 x、y 和 一 个 空格 〈 如 文中 记述) ， 那 么 信息 
MAW 其 时 其 其 其 YX 友基 XYWY 计 其 区 下 炎 


如 何 编 但 ? 


. 对 彩色 卡通 编码 时 ， 为 什么 GIF 比 JPEG 要 好 ? 


4. 假设 你 是 一 名 太空 船 设计 成 员 ， 它 要 驯 向 其 他 星球 并 带 回 照片 。 那 么 ， 为 了 减少 存储 资源 以 及 传输 


< OO Cn 


图 像 ， 使 用 GIF 或 JPEG 的 基准 标准 压缩 照片 是 天 是 一 个 好 主意 ? 


. JPEG 的 基准 标准 利用 了 人 耳 的 什么 符 性 ? 
. MP3 利 用 了 人 耳 的 什么 特性 ? 
. 说 出 编码 数字 信息 、 图 像 和 声音 为 位 模式 时 一 种 常见 的 肪 烦 现 象 。 
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卫生 HP 于 本 村 车 三 疝 大 大 下 人 


二 9 “通信 差 氏 


当 信息 在 计算 机 的 各 部 分 之 间 来 回 传输 ， 或 在 月 球 和 地 球 之 间 来 回 传输 ， 又 或 者 只 是 保存 
在 存储 器 中 ， 最 终 检索 到 的 位 模式 还 是 有 可 能 和 最 原始 的 不 一 致 。 灰 人 尘 粒 、 磁 盘 表 面 的 油脂 或 
者 一 个 出 故障 的 电路 都 可 能 使 数据 错误 地 记录 或 读 取 。 传 输 过 程 的 静电 干扰 可 能 会 损坏 一 部 分 
数据 。 而 且 在 茶 些 技术 条 件 下 ， 普 通 的 隐蔽 8 放射线 可 以 改变 计算 机 主 存储 器 中 存储 的 模式 。 

为 了 解决 这 样 的 问题 ， 人 们 开发 了 许多 编码 技术 来 检测 甚至 校正 错误 。 今 天 ， 由 于 这 些 技术 大 
规模 地 应 用 于 计算 机 系统 的 内 部 构件 中 ， 计 算 机 使 用 者 并 不 了 解 它 们 。 不 过 ， 它 们 的 存在 是 很 重要 
的 ， 为 科学 研究 做 出 了 很 大 的 贡献 。 因 此 ， 我 们 研究 一 些 使 计算 机 设备 可 靠 的 技术 是 很 适宜 的 。 


1.9.1 奇偶 校 验 位 


一 种 简单 的 检 训 错误 的 方法 是 基于 下 面 的 原则 ， 即 如 果 被 操作 的 每 个 位 模式 有 麻 数 个 1， 而 
找到 了 有 偶数 个 1 的 模式 ， 那 么 一 定 是 出 错 了 。 使 用 这 个 原则 ， 我 们 需要 一 个 编码 系统 ， 其 中 每 
个 模式 有 奇数 个 1。 这 是 很 容易 做 到 的 ， 首 先 只 要 在 系统 已 经 可 用 的 模式 〈 也 许 在 高 位 端 ) 上 添 


加 一 位 ， 称 为 麻 偶 校 验 位 〈parity bit)。 在 任何 情况 下 ， 我 们 赋值 1 或 0 给 这 个 新 的 位 。 这 样 最 后 


整个 模式 就 有 奇数 个 1。 一 旦 我 们 这 样 调整 了 编码 系统 ， 有 偶数 个 1 的 模式 就 表示 出 现 了 错误 ， 
被 操作 的 模式 也 是 不 正确 的 。 

图 1-28 辐 我们 展示 了 了， 奇偶 校 验 位 如 何 加 到 字母 A 和 FE 的 ASCII 代 码 上 。 注意 ，A 的 代码 变 成 
了 101000001 《奇偶 校 验 位 为 1)，F 的 ASCII[ 码 变 成 了 001000110 《奇偶 校 验 位 为 0)。 尽 管 A 原 始 
的 8 位 模式 有 偶数 个 1，F 原 始 的 8 位 模式 有 奇数 个 1， 但 它们 的 9 位 模式 都 有 奇数 个 1。 如 果 这 种 技 
术 应 用 于 所 有 的 8 位 ASCII 模 式 ， 我 们 就 能 够 得 到 一 个 9 位 编码 系统 ， 其 中 任何 一 个 9 位 模式 有 偶 
数 个 1 就 表明 出 错 了 。 


奇偶 校 验 位 奇偶 校 验 位 


A 的 ASCII 码 售 有 偶数 个 1 F 的 ASCH 码 含有 奇数 个 1 





二 01L0000013 01L100011 0 


一 -一 一 一 一 一 一 人 ER ee 一 一 一 一 -一 一 一 -一 一 一 一 一 1 CT 


辖 个 位 模式 含有 音 数 个 1 整个 位 模式 售 有 彰 数 个 1 
图 1-28 适用 奇 悦 验 的 字母 A 和 FE 的 ASCII 码 


上 面 描述 的 奇偶 校 验 系 统称 为 奇 校 验 ， 因 为 我 们 设计 的 系统 使 得 每 一 个 正确 的 模式 都 有 奇 
数 个 1。 另 一 种 技术 称 为 偶 校 验 。 在 一 个 偶 校 验 系 统 中 ， 每 个 模式 设计 成 包含 偶数 个 1， 因 此 ， 


如 果 出 现 了 奇数 个 1， 那 么 就 表明 有 错误 。 


今天 ， 发 现在 计算 机 主人 存储 器 中 使 用 了 奇偶 校 验 位 已 经 不 是 一 件 稀奇 的 事 了 。 尽 管 我 们 假 
设 这 些 计算 机 存储 单元 是 8 位 的 ， 但 事实 上 ， 它 们 可 能 是 9 位 ， 其 中 一 个 位 用 作 奇 偶 校 验 位。 每 
次 传输 一 个 8 位 模式 给 存储 电路 存储 ， 电 路 都 会 给 其 加 上 一 个 校 验 位 ， 存 储 结果 的 9 位 模式 。 在 
后 来 检索 模式 时 ， 电 路 检验 这 个 9 位 模式 的 校 验 位 。 如 果 这 样 没 有 发 现 错误 ， 存 储 器 就 移 走 校 验 
位 ， 然 后 目 信 地 返回 余下 的 8 位 模式 。 否 则 ， 存 储 器 返回 那 8 个 数据 位 ， 并 警告 ， 返 回 的 模式 可 
能 与 仔 储 器 原始 的 模式 不 同 。 

直接 使 用 校 验 位 很 简单 ， 但 是 有 其 局 限 性 。 如 果 一 个 模式 最 初 有 奇数 个 1， 并 出 现 了 2 次 错 
误 ， 那 么 它 就 仍然 有 奇数 个 1， 这 样 校 验 系 统 就 无 法 发 现 其 错误 。 事 实 上 ， 直 接 使 用 校 验 位 不 能 
发 现 模式 中 任何 偶数 个 错误 。 
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一 种 有 时 适用 于 长 位 模式 的 方法 可 以 缩小 这 个 问题 ， 例 如 磁盘 扇 区 存储 的 位 种。 这 种 情况 
下 ， 模 式 都 有 一 组 校 验 位 ， 它 们 构成 校 验 字 节 (checkbyte)。 校 验 字 节 中 的 每 一 个 位 是 一 个 校 验 
位 ， 与 散布 于 整个 模式 中 的 -- 组 特殊 位 相 联 系 。 例 如 ， 一 个 校 验 位 可 能 与 该 模式 中 从 第 一 个 位 
”起 的 每 个 第 8 位 相关 联 ， 而 另 一 个 与 该 模式 中 从 第 二 位 起 的 每 个 第 8 位 相关 联 。 这 样 ， 集 中 在 原 

模式 某 个 区 域 中 的 一 组 差错 就 很 可 能 被 发 现 ， 因 为 它 会 在 一 些 校 验 位 的 范围 内 。 这 个 校 验 字 节 概 
念 的 演变 引出 了 称 为 校 验 和 及 循环 元 余 校 验 〈cyclic redundancy checks，CRC) 的 差错 检测 方案 。 


1.9.2 ” 纠 销 纺 码 


尽管 使 用 校 验 位 可 以 发 现 差错 ， 但 是 它 不 能 提供 纠正 那个 差错 所 需 的 信息 。 既 能 够 发 现 差 
错 又 能 纠正 差错 的 纠 错 码 (error-correcting code) 被 设计 出 来 令 很 多 人 感到 惊讶 。 毕 竟 直 觉 告诉 
我 们 ， 如 果 我 们 不 知道 信息 的 内 容 我 们 就 无 法 纠正 接收 信息 中 的 错误 。 但 图 1-29 给 我 们 展示 了 
一 个 具有 这 样 纠 错 特性 的 编码 。 

为 了 明日 这 个 编码 是 如 何 运 作 的， 我 们 先 定 义 充 明 距 离 (Hamming distance)〔 根 据 R，W 
Hamming 的 姓氏 命名 ， 由 于 在 20 世 纪 40 年 代 继电器 可 靠 性 的 缺乏 上 受到 掩 折 ， 他 开始 引领 纠 错 
码 的 研究 )。 两 个 模式 之 间 的 汉 明 距离 指 的 是 这 两 个 模式 中 不 相同 位 的 个 数 。 例 如 ， 图 1-29 代 码 
中 表示 A 和 B 模 式 的 汉 明 距离 是 4， 帮 和 生生 图 1-29 代 码 中 最 重要 的 特征 是 ,任何 两 个 模式 之 
间 的 汉 明 距离 至 少 是 3。 

如 果 用 图 1-29 的 模式 修改 单个 位 , 就 会 发 现 错误 , 因为 它 的 结果 不 会 是 一 个 合法 的 模式 。 (我 
们 至 少将 每 个 模式 改变 3 个 位 ， 这 样 它 们 才 会 像 另 外 一 个 合法 模式 。) 而 且 ， 我 们 能 够 指出 原始 


异 陈 是 什么 。 站 竟 ， 修 改过 的 模式 和 其 原始 形式 的 汉 明 距离 是 1， 而 和 其 他 任何 合法 模式 的 汉 明 


臣 离 至 少 是 2?。 

因 上 此， 解码 最 初 用 图 1-29 编 码 的 信息 ， 我 们 只 需要 对 比 接收 模式 和 用 此 代码 表示 的 模式 ， 
直到 我 们 找到 一 个 和 接收 模式 之 间 的 汉 明 距离 是 1 的 模式 为 止 。 我们 将 其 视 为 正确 的 符号 进行 
解码 。 例 如 ， 我 们 接收 到 位 模式 010100， 然 后 将 其 与 用 代码 表示 的 模式 相 比 ， 我 们 就 会 获得 
图 1-30 中 所 示 的 表格 。 因 此 ， 我 们 得 出 结论 ， 传 输 的 字符 一 定 是 D， 因 为 这 样 最 匹配 。 


上 接收 到 的 模式 与 
符号 代码 字符 人。 加 放 的 模 芭 代码 之 间 的 距离 
是 本 辣 电 总 久 on0no000 Dan0dtn00 2 
B 001111 百 【1 4 
CC 10011 忆 6011 有 有 10010350 3 
D Dl1zdl100 D 站 下 最 个 
上 苹 全 二 了 划 下 杖 4 综 识 
时 1 人 工人 站] F LO0O1lD0D01 00141010 5 
JU1 惠 10101 0101 0 人 到 
日 111010 H 0 和 
图 1-29 ”一 个 纠 错 码 图 1-30 用 赂 1-29 的 代码 解码 模式 010100 


可 以 发 现 ， 使 用 图 1-29 的 编码 技术 ， 每 个 模式 我 们 检测 出 2 个 错误 ， 并 改正 1 个 。 如 果 我 们 
能 设计 出 一 种 编码 ,每 个 模式 和 其 他 任何 模式 之 间 的 汉 明 距离 都 至 少 是 5， 每 个 模式 我 们 就 将 发 
现 4 个 错误 ， 并 改正 2 个 。 当 然 ， 设 计 一 种 具有 长 汉 明 距离 的 编码 不 是 一 件 简单 的 事 。 事 实 上 ， 
它 是 称 为 代数 编码 理论 的 数学 分 支 的 一 部 分 ， 这 个 理论 是 线性 代数 和 和 矩阵 理论 的 子 领域 。 

纠 错 技术 被 广泛 用 于 增加 计算 设备 的 可 靠 性 。 例 如 ， 它 们 经 常 被 用 于 高 容量 磁盘 设备 ， 以 
减少 因 磁 盘 表 面 瑕 疯 而 损坏 数据 的 可 能 性 。 此外， 最 初 用 于 音频 的 CD 格式 与 后 来 用 于 计算 机 数 
据 和 仓储 的 格式 之 间 的 主要 差别 是 纠 错 的 程度 。CD-DA 格 式 包括 的 纠 错 特点 使 得 错误 率 减 少 到 2 
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张 CD 只 有 1 个 错误 。 这 对 视频 录制 足够 了 ， 但 是 对 于 用 CD 向 客户 交付 软件 的 公司 ， 磁 盘 50 久 的 
瑕 狂 是 无 法 忍受 的 。 因 此 ， 人 们 将 附加 的 纠 错 特征 用 在 CD 中 来 存储 数据 ， 使 产生 错误 的 可 能 性 
减少 到 20 000 个 磁盘 1 个 错误 。 


问题 与 练习 


1. 下 面 字 节 最 初 是 用 奇 校 验 编 码 的 。 拷 出 出 错 的 一 个 。 
a Tul01101 b.10000001 c.00000000 dll100000 驴 11111111 
2. 问题 1 中 没 发 现 错误 的 字 节 还 会 有 错误 吗 ? 解释 原因 
3 如果 将 育 校 验 换 成 偶 校 验 ， 那 么 问题 1 和 问题 2 的 答案 又 将 如 何 ? 
4. 用 带 奇 校 验 的 ASCII 编 码 这些 语 名 ， 在 每 一 个 符号 代码 的 高 位 端 加 一 个 校 验 位 。 
a._ Where are You? 
b.“How?”Cheryl asked. 
C. 了 二 3=. 
. 用 图 1-29 的 纠 错 码 ， 解 码 下 面 的 信息 。 
a001111 100100 001100 
b. 010001 000000 001011 
c. 训 LDOlO 110130 100000 D11100 
6. 用 长 度 为 5 的 位 模式 ， 为 字符 A、B、C 和 D 建 造 一 个 编码 ， 使 得 任何 两 个 模式 之 间 的 汉 明 距离 至 少 是 3。 


【站 


二 全 二 = 贡生 本 下 二 所 <- 和 于 中” 和 夭 汪 rm 二 半生 和 本 亲生 本 拓 攻 下 囊 RIT 让 和 和 条 交 二 1 全 ac 了 二 下 FE 生 下 [条 各 衣 AH 5 计 月 1 pmp 和 rnt ar 了 


复习 题 


( 带 * 的 题目 涉及 选读 小 节 的 内 容 。) c， 
1. 假设 上 面 输入 为 1 下 面 输入 为 0 , 请 确定 下 面 Ts 
每 一 个 电路 的 输出 值 。 
到 广 ”> 3. 在 下 面 的 每 一 个 电路 里 , 矩形 框 表示 相同 类 型 
站 的 门 。 根 据 图 中 给 出 的 输入 和 输出 信息 ,辨别 
它们 是 与 门 、 或 门 还 是 异 或 门 。 
TD 
让 。 
-ED 


2. 观察 下 面 的 每 一 个 电路 , 找 出 输出 值 为 1 的 输 
和 人 组 合 。 


站 疡 一 
4. 假设 下 面 电 路 的 两 个 输入 都 是 1。 请 描述 如 果 
上 面 输出 暂时 变 为 0， 会 发 生 什么 ? 如 果 下 面 
输入 暂时 变 为 0， 又 会 发 生 什 么 ? 用 与 非 门 重 
新 绘制 这 个 电路 ， 











3. 


亿 


\ 


下 面 表格 表示 的 是 计算 机 主 存储 器 某 些 单元 
的 地 址 和 内 容 《采用 十 六 进 制 记 数 法 ) 。 首 先 
按照 这 个 存储 安排 ， 遵循 下 列 指令 ,记录 下 这 








皮 存 储 单 元 的 最 后 内 容 。 
地 址 内 容 
00 AB 
01 53 
02 D6 
03 02 





步骤 1， 将 地 址 为 03 的 单元 的 内 容 送 到 地 址 为 
00 的 单元 中 。 

步骤 2: 将 数值 01 送 到 地 址 为 02 的 单元 。 

步骤 3: 将 存储 在 地 址 01 的 数值 送 到 地 址 为 03 
的 单元 。 


. 如 采 每 个 单元 地 址 用 2 个 十 六 进 制 数字 表示 ， 


姥 么 一 台 计 算 机 的 主 存储 器 中 有 多少 个 单 
X? 如 所 用 4 个 十 六 进 制 数字 呢 ? 
什么 位 模式 可 以 用 下 面 的 十 六 进 制 记 数 法 表 
示 ? 

a,(-B bb.67 c.A9 d10 e FF 

下 面 十 六 进 制 记 数 法 表示 的 位 模式 中 , 最 高 有 
效 位 的 数值 是 什么 ? 

ayVF b.FF ec.8F d1IF 

用 十 六 进 制 记 数 法 表示 下 面 位 模式 。 

a. 01L0L1D0101015 b. 110010110111 

c. UNU0bl1101011 


. 假设 一 个 数码 相机 的 存储 容量 是 256 MB 。 如 
洒 每 个 像素 需要 3 个 字 节 的 存储 空间 ， 而 且 一 


张 照片 包括 每 行 1024 像 素 及 每 列 1024 像 素 , 那 
么 这 人 台数 码 相机 可 以 存 多 少 张 照 片 ? 


假设 一 张 图 片 以 1024 列 及 768 行 像素 的 矩形 形 


陈 显 示 在 计算 机 屏幕 上 。 如 果 需 要 8 位 来 编码 
颜色 和 每 个 像素 的 亮度 , 那么 整 幅 图 片 需要 多 
少 个 字 节 大 小 的 存储 单元 ? 


. a。 指出 主 存储 器 优 于 磁盘 存储 的 两 个 优点 。 


b， 指 出 磁盘 存储 优 于 主 存储 器 的 两 个 优点 。 


, 假设 你 120 GB 的 硬盘 只 剩 下 50 GB 是 空闲 的 ， 


堵 么 用 CD 备份 硬盘 上 的 资料 是 否 合理 ?用 
DVD 呢 ? 


攻 . 
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Lu 


之 


| 


让 和， 


Pi 
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- 如 采 磁 盘 的 每 一 个 扇 区 包含 1024 个 字 节 , 那么 


如 条 每 个 字符 用 Unicode 表 示 ， 存 储 一 页 文本 
大约 50 行 ， 每 行 100 个 字符 ) 需要 多 少 扇 区 ? 


- 用 ASCII 码 ， 每 页 3500 个 字符 ， 存 储 一 本 400 


页 的 小 说 需要 多 少 字 节 的 存储 空间 ? 如 果 用 
Unicode 又 需要 多 少 字 节 ? 


.一 个 便 盘 驱动 器 每 秒 钟 转 60 转 , 那么 它 的 等 待 


时 间 是 多 少 ? 


.如果 一 个 硬盘 驱动 器 每 秒 转 60 转 , 寻 道 时 间 是 


Lums， 那 么 它 的 平均 存 取 时 间 是 多 少 ? 


:如果 一 个 打字 员 每 天 24 小 时 的 打字 , 每 分 钟 60 


个 字 ， 那 么 这 个 打字 员 要 多 扩 能 填 满 容量 是 
040 MB 的 CD? 假定 一 个 单词 是 5 个 字符 ， 每 
个 字符 需要 1 个 字 节 的 存储 室 间 。 


.个 面 古 用 ASCII 编 码 的 信息 。 内 容 是 什么 ? 


01010111 ulL1L00001 01110100 
bu0100000 
虽 L101111 
bl1JL0O1001 
oub100000 
00111111 
下 面 信 息 使 用 ASCII[ 编 码 ， 每 个 字符 一 个 字 
六 ， 并 用 十 六 进 制 记 数 法 表示 出 来 。 内容 是 什 
人 么 ? 

68657861646563696D616C 

用 ASCHI 编 码 下 面 的 句子 ， 每 个 字符 一 字 节 。 
a. TUD/5=20 

b. To be or not to be? 

c. The total cost is 中 7. 25. 

将 六 面 问题 的 答案 用 十 六 进 制 记 数 法 表示 出 
水 5 

列 出 整数 6 到 16 的 二 进 制 表示 。 

a. 分 别 用 ASCII 码 表示 2 和 6， 写 出 数字 26。 

b. 用 二 进 制 表示 写 出 数字 26。 


ULU1LO0n0 
0JLLUO1L00 
ulLUULUO1 
bl1110100 
UL110011 


ulil110011 00100000 


1L100001 01111001 


. 什么 值 的 二 进 制 表 示 只 有 一 个 位 为 1? 列 出 具 


有 这 个 特性 的 最 小 的 6 个 值 的 二 进 制 表示 。 
将 下 面 的 每 个 二 进 制 表示 转换 成 相应 的 十 进 


制 表 示 。 

a, 11 b.0001 c. 10101 

d. 10001 已. 卫 蝇 夏 工 工 ff 0D00000 
g.100 h. 1000 ij 10000 

站 11001 区 11010 111011 

将 下 面 每 个 十 进 制 表 示 转 换 成 相应 的 二 进 制 
aa blil ec.16 日 . 15 e. 33 
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*28. 将 下 面 的 每 一 个 余 16 表 示 转 换 成 相应 的 十 进 


制 表示 。 
a. 10000 b. 10011 .日 1 1 站 】 
dd D1111 已 . 工 口 1 1 1 

*29. 将 下 面 的 每 一 个 十 进 制 表 示 转 换 成 相应 的 祭 4 
表示 。 
3, 用 b. 3 ,一 了 由 . 一 】 怨 . 

“30. 将 下 面 的 每 个 二 进 制 补 码 表示 转换 成 相应 的 
十 进 制 表示 。 
3. 晶 1111 pb. 1I0011 C. 昌 LT1D1 
d. 10000 .111 


.将 下 面 的 每 个 十 进 制 表示 转换 成 相应 的 一 进 
制 补 码 表示 ， 其 中 每 个 值 用 7 位 表示 。 
a. 1 了 b. ~12 | 由 .0 已. 吕 
“32. 假定 下 面 这 些 位 串 都 表示 用 二 进 制 补 码 记 数 
法 表示 的 值 , 执行 下 面 这 些 加 法 运算 。 辨 别 哪 


+ 


一 个 由 于 溢出 而 答案 不 正确 。 
呈 ， 昌 口 1 站 1 pb，11111 C。， 癌 1111 
+01000 +00001 +00001 
10111 0111 ft 00111 
+11010 十 40113 十 1100 
gg，11111 h，01010 1 01000 
二] 11 土 bUgU1L 士 日 呈 0 吕 
下 01010 
十 ] 中] 01 


“33. 解答 下 面 的 每 个 问题 : 将 这 些 值 翻译 成 二 进 制 
补 码 记 数 法 〈 用 5 位 模式 )， 转 换 任 何 一 个 减法 
运算 为 相应 的 加 法 运算 并 执行 。 将 所 得 答案 转 
换 成 十 进 制 记 数 法 进行 验证 。( 观 察 溢出 现象 。) 


8 7 了 b， 7 C。、12 
+1 -4 
d， 入 e.]2  . f. 5 
> 3 AR 
“34. 将 下 面 的 每 个 二 进 制 表示 转换 成 相应 的 十 进 
制 表 示 。 
a llL.01L1 bi1i00.0101 ,电工 
人 .1 .0 已. J 避 . 口 1 
“35. 用 二 进 制 记 数 法 表示 下 面 每 个 值 。 
和 5 工 b. 下 CC， 7- 
十 1 8 
了 ] 
， 一 ， 百 一 
已 8 


“36. 用 图 1-26 所 示 的 浮 点 格式 解码 下 面 的 位 模式 。 
a.01011010 b.11001000 ec.00101100 
d 10111001 


“37. 用 赂 1-26 所 示 的 8 位 浮 点 格式 来 编码 下 面 的 
全 。 指 出 出 现 截断 误差 的 每 个 情形 。 


| 】 3 
， 一 bb， 7 一 C， 一 3 一 
2 7 亲 

31 
由， 一 心 ，。 一 -一 

32 32 


*38, 假定 你 不 受 使 用 标准 化 格式 的 限制 , 用 图 1.26 
所 示 的 泽 点 格式 列 出 所 有 可 以 和 表 示 数 值 的 
位 模式 。 

*39. 用 图 1-26 所 示 的 8 位 浮 点 格式 ， 求 可 以 表示 的 
最 近似 于 2 的 平方 根 的 值 。 如 果 计 算 机 利用 浮 
点 格式 对 这 个 数 做 平方 ， 实 际 得 到 的 信和 是 什 
人 

*40. 用 图 1-26 所 示 的 浮 点 格式 可 以 表示 的 最 近似 

于 二 的 数值， 

当 米 制 系统 的 度量 用 浮 点 记 数 法 记录 时 ,解释 

为 什么 会 产生 误差 ?例如 ， 110 cm 用 米 制 单元 

记录 情况 会 怎样 ? 

“42. 用 图 1-26 所 示 的 8 位 浮 点 格式 ， 从 左 至 右 计 算 
8++2 二 的 结果 是 多 少 ? 从 右 至 左 呢 ? 
“43. 用 图 1-26 所 示 的 8 位 浮 点 格式 ， 求 计算 机 可 以 
得 出 的 下 面 每 个 问题 的 答案 。 

1 3 


a， 一 十 一 - 三 


2 16 


4] . 


2 


本 
4 


C， 2+1L- 
二 8 
44. 在 下 面 的 加 法 问题 中 ， 用 图 1-26 所 示 的 8 位 符 
所 格式 解释 这 些 位 模式 , 将 表示 的 值 相 加 , 再 
将 答案 用 相同 的 符 点 格式 编码 。 辨 别 截断 误 


差 出 现 的 情况 。 
a，01011100 b、D1011000 
+bllI0Ql0on =ul0ol1000 
CD01111000 d，01101010 
+0b0o0l1000 -0ull11000 
“45. 位 模式 01011 和 11011 表 示 同 一 个 值 ， 一 个 用 祭 


16 记 数 法 存储 , 另外 一 个 用 二 进 制 补 码 记 数 法 

存储 。 

a 共同 表示 的 这 个 值 是 什么 ? 

b. 同一 个 值 分 别 用 二 进 制 补 码 记 数 法 和 余 码 
记 数 法 存储 ， 并 且 这 两 个 系统 采用 相同 的 
位 模式 长 度 ， 那 么 表示 此 值 的 这 两 种 模式 


社会 问题 ”49 


是 一 种 什么 关系 ? *54. 下 面 信 息 使 用 LZW 压 缩 ， 其 字典 的 第 1、2 和 3 

*d46. 3 个 位 模式 01101000、10000010 和 00000010 表 个 条 目 分 别 是 xz、y 和 竺 格 。 解 压缩 这 条 信息 
示 同 一 个 值 ， 分 别 是 采用 二 进 制 补 码 记 数 法 ， 22123113431213536 
余 码 记 数 法 和 图 1-26 所 示 的 8 位 浮 点 格式 ， 但 *55. 如 果 信 息 
并 不 是 必须 按照 上 面 顺序 一 一 对 应 的 。 那 么 它 WA 
们 共同 表示 的 值 是 什么 ? 哪个 模式 对 应 哪个 用 LZW 压 缩 ， 最 初 字 典 的 第 1、2 和 3 个 条 目 分 
记 数 法 ? 别 是 x、y 和 空格 。 那 么 最 后 的 字典 条 目 是 什 

*47. 在 下 面 的 每 一 情况 中 , 不 同 的 位 串 表 示 的 是 同 公 ? 

一 个 值 , 但 使 用 我 们 前 面 讨论 过 的 、 不 同 的 数 *56. 我 们 下 一 章 要 学 到 , 通过 传统 电话 系统 传输 位 
值 编码 系统 。 求 出 表示 的 值 及 所 用 的 编码 系 的 一 种 方法 是 ,首先 将 位 模式 转换 成 声音 , 通 
统 。 过 电话 线 传 输 声音 , 接 痢 再 将 声音 转换 成 位 模 
alLlLtli0l000LL1011 却 。 这 种 技术 的 传输 速率 最 多 可 达 357.6 Kbits。 
b.11111101 0111110111101100 那么 如 果 视 频 采 用 MPEG 压 缩 ， 是 和 否 能 满足 远 
c.1010001001101000 程 会 说 的 需要 ? 

*48. 在 下 面 的 位 模式 中 , 哪 一 个 不 是 余 16 计 数 系 统 *57. 使 用 ASCII 码 ， 每 个 字符 一 字 节 ， 编 码 下 面 的 
的 侣 法 表示 ? 句子 。 将 每 个 字 节 中 的 最 高 有 效 位 作为 《〈 奇 ) 
a.01001 bb.101 c.010101 校 验 位 。 

d.00000 ee.1000 f 000000 a._ 100/5=20 
g- II11 b. TIo be or not to be7 

*d49. 在 下 面 的 值 中 , 哪 一 个 不 能 用 图 1-26 所 示 的 浮 c. The total cost js 出 了. 25. 

点 格式 精确 地 表示 出 来 ? *58. 下 面 信息 的 每 一 个 短 位 串 , 最 初 都 是 用 奇 校 验 
6L bg Ba yi 。 芒 传输 的 。 那 么 哪 一 个 位 串 绝对 会 有 差错 ? 
2 16 .32 16 11001 .11011 10110 00000 11111 

*50, 用 二 进 制 表示 整数 的 4~8 位 的 位 串 ， 如 果 加 倍 10001 10101 00100 01110 
其 位 串 长 度 , 那么 能 够 表示 的 最 大 整数 值 会 发 *59. 假如 一 个 24 位 的 代码 是 这 样 产生 的 : 复制 3 个 符 
生 什么 变化 ? 用 二 进 制 补 码 记 数 法 又 将 如 何 号 连续 的 ASCI 编 码 ， 并 用 它们 表示 每 个 符号 
呢 ? 《例如 , 符号 A 用 位 串 010000010100000101000001 

*51. 一 个 存储 器 容量 4MB， 每 个 单元 可 以 存储 1 字 表示 ) 。 这 个 新 代码 有 哪些 纠 错 特性 ? 

节 ， 那 么 其 最 大 地 址 的 十 六 制 表 未 是 什么 ? *60. 用 图 1-30 的 纠 错 码 解码 下 面 词语 。 

*52. 用 门 设 计 一 个 有 4 个 输入 和 1I 个 输出 的 电路 , 并 a.111010 110110 

” 且 使 得 4 位 输入 模式 的 奇偶 校 验 决 定 输出 是 1 b. 101000 100110 001100 
还 是 0。 c.011101 000110 000000 010100 

*53, 司 用 LZW 上 压缩 ,并且 最 初 的 字典 是 x、y 和 一 个 d.010010001000 001110 101111 
空格 ， 那 么 下 面 的 信息 如 何 编码 ? 000000 110111 100110 
XRKWY YYX XXY MMXKY YX e.0100110006000 101001 100110 
会 问题 


下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 这 些 问题 不 
是 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 东 个 截断 错误 出 现在 一 个 关键 时 刻 ， 引 起 了 巨大 的 损失 和 人 身 伤亡 。 如 果 有 人 需要 对 此 

负责 ， 那 么 是 谁 ? 硬件 设计 者 ? 软件 设计 者 ? 编写 那 段 程序 的 程序 员 ? 决定 在 那个 特定 

应 用 中 使 用 这 个 软件 的 人 ? 如 果 最 初 设计 这 个 软件 的 公司 已 经 修正 过 这 个 软件 ， 但 是 用 

万 还 没有 购买 这 个 升级 版 并 用 于 这 个 关键 应 用 中 ， 又 将 如 何 ? 如 果 这 个 软件 是 盗版 的 ， 
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又 将 如 何 ? 


. 当 一 个 人 开发 的 应 用 忽略 截断 错误 的 可 能 性 及 它们 的 后 果 ， 这 是 可 以 接受 的 吗 ? 
. 如 果 在 20 世 纪 70 年 代 只 用 2 个 数字 开发 表示 年 的 软件 〈 例 如 用 76 表 示 1976 年 )， 而 忽视 了 


这 个 软件 在 即将 到 来 的 世纪 之 交会 失效, 这 符合 伦理 道德 吗 ? 关 今 天 只 用 3 个 数字 表示 年 
(例如 用 982 表 示 1982，015 表 示 2015$) 又 是 否 符 合 伦 理 呢 ?如 果 只 用 4 个 数字 呢 ? 


: 许多 人 认为 ， 对 信息 进行 编码 经 单 会 削弱 或 乍 曲 该 信息 ， 因 为 这 实质 上 迫使 信息 必须 被 


量化 。 他 们 认为 ， 者 一 份 调查 问 优 每 题 给 出 了 5 个 等 级 ， 并 要 求 回答 者 按照 此 标准 表达 意 
见 ， 那 这 份 问 郑 本 喘 就 是 无 效 的 。 信 息 可 以 量化 到 什么 程度 ? 废品 处 理 厂 不 同位 置 选择 
的 利 兖 可 以 量化 吗 ? 关于 核能 源 及 核 废 料 的 辩论 是 可 量化 的 吗 ? 将 结论 建立 于 平均 值 和 
其 他 的 统计 分 析 上 的 做 法 危险 吗 ? 能 够 量化 一 个 人 的 生命 值 吗 ? 假设 一 个 公司 要 停止 对 
一 个 产品 改进 的 投资 ， 尽 管 附 加 投资 可 以 减少 产品 使 用 的 危险 性 ， 这 合理 吗 ? 


. 在 收集 和 向 发 数 据 的 权利 上 ， 是 否 根 据 数 据 的 形式 有 所 差别 ? 也 就 是 说 ， 收 集 和 散发 昭 


片 、 音 频 或 者 视频 的 权利 是 否 与 收集 和 散发 文本 一 样 ? 


. 无 论 有 意 还 是 无 意 ， 记 者 的 报道 通常 反映 了 自己 的 倾向 。 通 常 只 要 改 几 个 词语 ， 一 篇 报 


起 就 可 能 赋 子 正面 或 负面 的 舍 义 《比较 :“ 大 多 数 被 调查 的 人 午 反 对 ……” “被 调查 人 
中 有 相当 一 部 分 支持 ……”) 修改 一 篇 报道 《回避 某 些 观 点 或 者 仔细 选 词 》 和 修改 一 张 昭 
片 有 区 列 吗 ? 


. 假设 用 数据 压缩 系统 后 导致 一 些微 小 但 很 重要 的 信息 持 失 了 。 会 产生 什么 样 的 责任 问 


题 ? 怎么 解决 ? 
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智和 章 





数据 操控 


重 学 习 计算 机 如 何 操纵 数据 以 及 如 何 与 外 围 设 备 〈 如 打印 机 和 键盘 ) 通信 。 为 此 ， 我 
们 将 研究 计算 机 体系 结构 的 基础 , 学 习 计算 机 是 如 何 利用 称 为 机 器 语言 指令 的 编码 指 
令 来 进行 编程 工作 的 。 
在 第 1 章 中 , 我 们 学 习 了 有 关 计 算 机 数据 存储 的 主题 , 本 章 将 介绍 计算 机 如 何 操控 这 些 数据 。 
其 内 容 包 括 数据 在 不 同位 置 间 的 传输 ， 以 及 诸如 算术 计算 、 文 本 编辑 和 图 像 处 理 等 的 操作 。 首 
先 我 们 要 了 解除 数据 存储 系统 之 外 的 计算 机 体系 结构 。 


人 站 


二 本 和 后 | 征 入 秆 机 是 于 各 让 直下 有 HE 生 仙 -ni 和 
局 | ] 

本 站 二 三 昌 
WIRE 人 aa 


计算 机 中 控制 数据 操纵 的 电路 称 为 中 央 处 理 器 《central processing unit，CPU， 通 常 简称 为 
处 理 器 )。 在 20 世 纪 中 期 ，CPU 属 于 大 部 件 ， 由 若干 机 架 中 的 电子 线路 组 成 ， 这 也 反映 了 该 部 件 
的 重要 性 。 不 过 ， 科 技 进 步 已 经 极 大 地 缩小 了 这 些 部 件 。 今 天 ，PC 机 中 的 CPU 都 是 很 小 的 正 
方形 浒 片 ， 如 英特尔 公司 生产 的 奔腾 处 理 器 和 赛 扬 处 理 器 以 及 AMD 公 司 生 产 的 Athlon 处 理 器 和 
Sempron 处 理 器 大约 都 只 有 2X2 英 寸 , 它 的 引 脚 插 在 计算 机 主 电路 板 ( 称 为 主板 (motherboard)) 
的 揪 座 上 。 由 于 他 们 的 规模 比较 小 ， 因 此 这 些 处 理 器 被 称 作 微 处 理 器 (microprocessor)。 


2.1.1 CPU 基础 知识 


CEU 由 3 部 分 构成 〈 图 2-1): 算术 /逻辑 单元 〈arithmeticlogic unit) 一 一 它 包含 在 数据 上 执 
行 运 鼻 〈 如 加 法 和 减法 ) 的 电路 ， 控 制 单元 (control unit) 它 包 含 协 调 机 器 活动 的 电路 ; 
以 及 寄存 器 单元 〈register unit)， 它 包含 称 为 寄存 器 〈register) 的 数据 存储 单元 〈 与 主 存单 元 相 

似 )， 用 作 CPU 内 部 的 信息 临时 存储 。 
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图 2-1 通过 总 线 连接 的 CPU 和 主 存储 器 
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寄存 器 单元 中 的 一 些 寄存 器 被 看 成 是 通用 寄存 器 〈general-purpose register)， 而 其 他 一 些 则 
被 看 成 是 专用 寄存 器 〈special-purpose register)， 我 们 将 在 2.3 节 讨论 一 些 专用 寄存 器 ， 现 在 我 们 
只 关注 通用 寄存 器 。 

通用 寄存 器 用 于 临时 存储 由 CPU 正在 操纵 的 数据 。 这 些 寄存 器 存储 算术 / 迎 辑 单元 电路 的 
输入 值 以 及 该 部 件 所 产生 的 结果 。 为 了 操作 存储 在 主 存储 器 中 的 数据 ，CPU 要 把 存储 器 里 的 数 
据 传送 到 通用 寄存 器 , 通知 算术 /逻辑 单元 由 哪些 寄存 器 保存 了 这 一 数据 ,激活 算术 /逻辑 单元 中 
的 有 关 电 路 ， 并 告知 算术 /逻辑 单元 哪个 寄存 器 将 接收 结果 。 

为 了 传输 位 模式 ， 计 算 机 CPU 和 主 存储 器 通过 一 组 称 为 总 线 (bus， 图 2-1) 的 线路 进行 连 
接 。 利 用 总 线 ，CPU 给 出 相关 存储 单元 的 地 址 以 及 相应 的 电信 号 《告知 存储 如 电路 ， 将 在 指定 

单元 中 获取 数据 )， 从 主 存储 器 中 取 【〈 读 ) 出 数据 ， 同 理 ，CPU 可 以 向 主 存储 器 中 放 入 《〈 写 入 ) 
数据 ， 通 过 提供 目的 单元 地 址 和 一 起 写 入 的 数据 以 及 适当 的 电信 号 《告知 主 存储 器 ， 将 要 发 送 
给 它 的 数据 )。 

基于 此 设计 ， 将 存储 在 主 存储 器 中 的 两 个 值 相 加 的 任务 不 仅 执行 加 法 运算 。 数 据 必 须 抑 从 
主 存储 器 传输 到 CPU 的 寄存 器 中 ， 值 相 加 后 ， 结 果 放 置 在 寄存 器 中 ， 然 后 再 把 结果 存储 到 主 存 
单元 中 。 整 个 过 程 被 总 结 成 如 图 2-2 所 示 的 5 个 步骤 。 


步骤 1:， 从 存储 器 中 取出 一 个 要 加 的 值 放 入 一 个 寄存 器 中 。 
步骤 2: 从 存储 器 中 取出 男 一 个 要 加 的 值 放 入 劝 一 个 罕 伍 肯 中 。 


步骤 3， 激 活 加 法 电路 ， 以 步骤 1 和 2 所 用 的 寄存 器 作为 输入 ， 用 另 一 个 寄存 器 存放 相 加 的 结果 。 
步骤 4， 将 结果 他 人 人 存 情 名 。 
步骤 $， 人 停止。 





图 2-2“ 主 存储 器 中 的 值 相 加 
2.1.2 ”存储 程序 概念 


早期 计算 机 不 是 很 灵活 ， 每 个 设备 所 执行 的 步骤 都 被 存 入 控制 单元 中 ， 作 为 计算 机 的 一 部 
分 。 为 了 增加 其 灵活 性 ， 早 期 电子 计算 机 的 设计 使 得 CPU 可 以 方便 地 重新 布线 。 其 灵活 性 通过 
插 拔 装置 体现 ， 类 似 于 老式 的 电话 交换 台 上 把 跳 线 的 端子 插 到 接线 孔 中 。 


高 速 缓冲 存 情 嚣 
将 计算 机 存储 设备 与 其 对 应 功能 进行 比较 是 很 有 局 发 的 。 寄 存 问 用 于 存储 可 立即 进行 运 
算 的 数据 ， 主 存储 器 用 于 存储 即将 使 用 的 数据 ， 海 量 存储 器 用 于 存储 最 近 也 许 不 会 使 用 的 数 
气 。 许 多 计算 机 设计 增加 了 一 个 附加 的 存储 器 层次 ， 称 为 高 速 缓 冲 存 储 器 . 高速 绥 冲 存 情 吴 
(cache memory ) 是 位 于 CPU 内 部 的 高 速 存 储 器 的 一 部 分 (也 许 有 凡 百 改 B ]。 在 这 个 特殊 的 存 
” 储 区 域 中 ， 计 算 机 试图 保存 主 存储 器 中 当前 最 重要 的 那 部 分 内 容 的 一 个 副本 : 这 样 ， 通 常委 
在 寄存 器 与 主 存储 器 之 间 进 行 的 数据 传输 将 变 成 寄存 器 与 高 速 缓冲 存储 器 之 间 的 数据 传输 。 
因此 ， 高 速 缓冲 存储 器 中 的 任何 改变 都 会 在 恰当 时 间 一 起 传输 给 主 存储 器 . 于 是 ，CPU 可 以 
较 快 地 执行 它 的 机 器 周期 ， 因 为 它 不 会 被 与 主 存储 器 的 通信 所 延迟 . 


认识 到 一 个 程序 可 以 像 数据 一 样 进 行 编码 和 存储 在 主 和 存储 器 中 ， 这 是 一 个 突破 性 进展 《但 
是 将 其 归功 于 约 得 : 冯 诺 依 曼 显 然 是 不 正确 的 )。 如 果 控 制 单元 可 以 从 存储 器 中 读 取 程序 、 将 
指令 解码 并 执行 它们 ， 那 么 机 器 要 遵照 执行 的 程序 就 可 以 修改 ， 这 只 需要 改变 计算 机 存储 器 中 
的 内 容 而 不 必 对 CPU 进行 重新 布线 。 


2.2 机 器 语言 53 
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将 计算 机 程序 存储 在 主 存储 器 中 的 思想 称 为 存储 程 库 概 念 〈 stored-program concept)。 它 已 经 
成 为 今天 所 使 用 的 标准 方法 。 节 杨 的 困难 源 于 人 们 将 程序 和 数据 视 为 不 同 的 实体 ; 数据 存储 在 存 
储 舌 中 ， 而 程序 为 CPU 的 一 部 分 。 于 是 就 成 了 “只 见 树 木 ， 不 见 森 林 ” 的 一 个 最 好 实例 。 人 们 很 
容易 被 老 一 套 所 束缚 ， 如 果 今 天 仍 不 了 解 这 一 点 ， 那 委 计算 机 科学 的 发 展 也 许 还 会 囊 足 不 前 。 的 
确 ， 科 学 中 令 人 兴奋 的 部 分 是 ， 新 的 思想 不 断 为 新 的 理论 和 新 的 应 用 的 产生 开启 大 门 。 


回 题 与 练习 

1. 将 计算 机 中 一 个 存储 单元 的 内 容 传输 给 另 一 个 存储 单元 ， 你 认为 需要 哪些 事件 序列 ? 
2 如果 将 一 个 值 写 入 存储 单元 中 ， 那 么 CPU 需要 提供 给 主 存储 器 电路 什么 信息 ? 

3. 海量 存储 器 、 主 存储 器 以 及 通用 寄存 器 都 是 存储 系统 。 它 们 在 用 法 上 和 有 什么 不 则 ? 
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为 了 应 用 存储 程序 概念 ， CPU 被 设计 成 可 以 识别 二 进 制 模式 编码 的 指令 。 这 组 指令 以 及 编 
位 系统 统称 为 机 器 语言 (machine language )。 使 用 此 语言 表达 的 指令 称 为 机 器 级 指令 ， 更 多 的 
称 为 机 器 指令 〈machine instruction ) 。 


2.2.1 指令 系统 


通 澡 一 个 典型 CPU 必须 能 够 解码 及 执行 的 指令 列表 要 求 非常 短 。 实际 上 ， 一 旦 计算 机 能 够 
实现 儿 个 基本 的 但 却 是 经 过 精心 挑选 的 任务 时 ， 那么 添加 再 多 的 特性 也 不 会 增加 该 计算 机 理论 
上 的 能 力 。 换 句 话 说， 超过 某 个 特定 点 之 后， 附加 的 特性 也 许 能 够 增加 诸如 便利 性 等 能 力 ， 但 
是 不 能 增加 该 计算 机 的 基本 能 力 。 

在 设计 计算 机 时 ， 该 事实 将 利用 到 何 种 程度 导致 了 两 种 CPU 体系 结构 的 出 现 。- 一 种 是 CPU 
从 需要 执行 最 小 的 一 组 机 器 指令 集 ， 因此 产生 了 精简 指令 集 计 算 机 (reduced instruction set 
computer，RISC)。RISC 的 支持 者 认为 ， 这 样 设计 的 计算 机 效率 高 且 速 度 快 。 改 一 方面 ， 另 外 
一 些 人 则 认为 ，CPU 应 能 够 执行 大 量 复杂 的 指令 ， 从 党 许多 在 技术 上 是 多 余 的 ， 因 此 产生 了 复 
杂 指 令 集 计 算 机 (complex instruction set computer， 人 (JSC)。CISC 的 支持 者 认为 ，CPU 越 复杂 越 
容易 编程 ， 因为 其 单个 指令 所 能 实现 的 任务 在 RISC 计 算 机 里 需要 许多 指令 才能 实现 ， 

CISC 和 RISC 处 理 器 在 商业 中 都 存在 。 英特尔 公司 开发 的 奔腾 系列 处 理 器 是 CISC 体 系 结构 
的 例子 ， 蔷 果 公 司 、 IBM 和 摩托 罗拉 公司 联合 开发 的 PowerPC 系 列 处 理 器 (包括 苹果 公司 称 为 
G4 和 G5S 的 处 理 器 ) 是 RISC 体 系 结构 的 例子 。 《苹果 公司 目前 正在 减少 使 用 PowerPC， 而 转向 使 
用 类 特 尔 公 司 生产 的 处 理 器 。 但 是 ， 此 改变 是 由 于 商业 原因 而 不 是 因为 RISC 与 CISC 体 系 结构 
间 的 区 别 。) RISC 处 理 器 的 其 他 常见 的 例子 包括 SPARC (可 伸缩 处 理 器 体系 结构 ) 系列 ， 它 是 
Sun Microsystems 的 产品 。 

不 管 选 择 RISC 还 是 CISC， 机 器 指令 可 以 分 为 3 类 :; (1) 数据 传输 类 ，(21 算术 / 逻 辑 类 ; (3) 
控制 类 。 

1.， 数据 传输 类 

数据 传输 类 指令 包含 请 求 在 各 个 位 置 之 间 传输 数据 的 指令 ， 图 2-2 中 的 步骤 1、2 和 4 都 属于 
这 一 闫 。 需 要 注意 的 是 ， 使 用 传输 (transfer) 或 移动 (move) 来 标识 这 组 指令 实际 上 是 用 词 不 
怡 当 的 。 因 为 传输 的 数据 很 少 能 从 原始 位 置 擦 除 。 执行 传输 指令 的 过 程 更 像 是 复制 数据 而 不 是 
移动 数据 ， 因 此 ， 复 制 〈copy) 或 克隆 《clone) 能 更 好 地 描述 这 组 指令 的 活动 。 
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关于 术语 ， 我 们 应 注意 到 ， 提 到 CPU 与 主 存储 器 之 问 数据 的 传输 时 ， 有 专门 的 术语 。 由 存 
储 单 元 的 内 容 填充 通用 寄存 器 的 请 求 通常 称 为 LOAD (加载 ) 指令 ， 相 反 ， 将 寄存 器 中 内 容 传 
输 给 存储 单元 的 请 求 称 为 STORE 〔〈 存 储 ) 指令 。 在 图 2-2 中 ， 步 骤 1 和 2 是 LOAD 指 令 ， 步 骤 4 左 
STORE 指令 。 

在 数据 传输 类 中 有 这 样 一 组 重要 的 指令 ， 即 与 CPU- 主 存储 器 环境 之 外 的 设备 〈 打 印 机 、 键 
盘 、 显 示 器 以 及 磁盘 驱动 器 等 ) 通信 的 指令 。 由 于 这 些 指令 处 理 该 机 器 的 输入 /输出 活动 《IO)， 
因此 被 称 为 VO 指 令 ， 且 有 时 因为 其 特别 而 单独 归 为 一 类 指令 。 另 一 方面 ，2.5 节 将 介绍 这 些 IO 
活动 如 何 利用 与 CPU 及 主 存储 器 之 间 传 输 数据 请 求 同 样 的 指令 来 完成 操作 。 因 此 ， 我 们 该 将 MO 
指令 归 入 数据 传输 类 指令 。 

2. 算术 /逻辑 类 

管 术 / 逻 辑 类 指令 告诉 控制 单元 请 求 在 算术 /逻辑 单元 内 实现 一 个 活动 。 图 2-2 中 的 步骤 3 属于 
这 -类 。 正 如 其 名 称 所 示 ， 算 术 / 罗 辑 单元 还 能 够 执行 基本 算术 运算 之 外 的 运算 。 在 这 些 附加 的 
运算 中 ， 就 有 第 1 章 中 介绍 的 布尔 运算 与 、 或 和 异 或 ， 本 章 后 面 将 进一步 讲解 。 

大 多 数 算术 /逻辑 单元 中 可 以 用 另外 一 组 运算 进行 寄存 器 中 内 容 的 左右 移动 。 这 皮 运 算 称 为 
移 位 〈SHIFT) 运算 或 循环 移 位 〈ROTATE) 运算 ， 前 者 捷 弃 一 端 “ 移 出 的 位 ”， 而 后 者 将 它们 
放 到 另 一 端 留 出 的 空位 上 。 

3. 控制 类 

扩 制 类 指令 包含 指导 程序 执行 而 非 数据 操作 的 指令 。 图 2-2 中 的 步骤 5 属于 此 类 ， 尽 管 它 是 
一 个 很 初级 的 例子 。 这 一 类 包括 计算 机 指令 系统 中 许多 比较 有 趣 的 指令 ， 例 如 JUMP《 转 移 ) 或 
BRANCH (分 支 ) 系列 指令 用 于 指示 CPU 执行 非 列 表 中 下 一 条 指令 的 指令 。 转 移 指 令 有 两 个 变 
体 ; 无 条 件 转移 〈unconditional jump) 和 条 件 转移 〈conditional jump )。 前 者 的 例子 如 “ 跳 转 到 
步骤 5”， 后 者 的 例子 如 “如 果 所 得 数值 为 0， 跳 转 到 步骤 5$”。 两 者 的 区 划 是 ， 只 有 满足 茶 个 条件 
了 时， 条 件 转移 才 会 引起 “地 点 改变 ” 举例 说 明 ， 图 2-3 中 的 指令 序列 是 表示 两 个 数值 相 除 的 算 
法 ， 其 中 步骤 3 是 条 件 转移 ， 用 以 防止 除数 为 0。 


步骤 1， 把 存储 器 中 一 个 值 加 载 到 一 个 寄存 器 中 。 
步骤 2: 把 存储 器 中 另 一 个 值 加 载 到 另 一 个 寄存 器 。 
步骤 3， 如 果 第 二 个 值 为 0， 那 么 转移 到 步 枝 6。 


步骤 4， 第 一 个 寄存 器 中 的 值 除 以 第 二 个 寄存 器 的 值 ， 结 果 留 在 第 三 个 寄存 器 中 。 
步骤 $， 把 第 三 个 寄存 器 的 值 存储 到 存储 器 。 
步骤 和: 迟 止 。 





图 2-3 计算 存储 器 中 数值 的 除法 运算 
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现在 让 我 们 来 分 析 一 台 典 型 的 计算 机 的 指令 是 如 何 编码 的 。 我 们 用 于 讨论 的 计算 机 在 附录 
C 中 描述 ， 其 体系 机 构 见 图 2-4。 它 有 16 个 通用 寄存 器 ，256 个 主 存储 器 单元 ， 每 个 存储 单元 容量 
为 8 位 。 为 了 便于 参考 ， 我 们 将 寄存 器 标号 为 数值 0 一 135， 把 存储 单元 的 地 址 纺 为 数值 0 一 255。 
为 方便 起 见 ， 我 们 将 这 些 标号 及 地 址 看 作 以 二 进 制 表示 的 数值 ， 并 使 用 十 六 进 制 记 数 法 压缩 它 
们 的 位 模式 。 于 是 ， 寄 存 器 标号 为 0-E， 存 储 单元 的 地 址 为 00~FF。 

机 器 指令 编码 形式 包括 两 部 分 ， 操 作 码 (operation code， 缠 写 为 op-code ) 字段 和 操作 数 
(operand) 字段 。 操 作 码 字段 中 的 位 模式 指明 该 指令 要 求 的 是 什么 基本 运算 , 如 SIORE、SHIFT、 
XOR 和 JUMP 等 。 操 作 数 字段 中 的 位 模式 提供 关于 操作 码 指定 运算 的 更 详细 的 信息 。 以 STORE 
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操作 为 例 ， 其 操作 数字 段 中 的 信息 指示 哪个 寄存 器 包含 被 存储 的 数据 ， 哪 个 存储 单元 用 于 接收 
该 数据 。 





CPU El 
地 址 ”单元 
寄存 器 
人 程序 计数 器 
全 局 线 0 
”加 人 
02 
| 
03 
[] B 





图 2-4 ”附录 C 描 述 的 计算 机 的 体系 结构 


变 长 指令 


为 了 简化 文中 的 解释 ， 附 录 C 描 述 的 机 器 语言 对 于 所 有 指令 都 使 用 了 国定 的 大 小 【2 个 字 
节 )。 因 此 ， 为 取得 一 个 指令 ，CPU 总 是 需要 检索 2 个 连续 存储 单元 的 内 容 ， 然 后 给 其 程序 计 
数 器 加 2。 这 种 连贯 性 简化 了 取 指 令 的 任务 ， 是 RISC 机 器 的 特性 。 然 而， 对 于 CISC 机 器 的 机 
器 语言 ， 指 令 长 度 可 变 。 例 如， 奔腾 系列 指令 长 度 有 大 有 小 ， 小 的 只 有 1 字 节 ， 长 的 要 多 个 字 
节 ， 这 取决 于 该 指令 的 确切 应 用 .使 用 这 样机 器 语言 的 CPU 根据 指令 操作 码 来 确定 所 引入 指 
令 长 度 。 也 就 是 说 ，CPU 首 先 取 指 令 的 操作 码 ， 然 后 基于 收 到 的 位 模式 得 知 : 要 得 到 余下 的 
指令 还 需要 从 存储 器 中 取 甸 少 字 节 。 


我 们 演示 用 的 计算 机 《〈 见 附录 C) 的 整个 机 器 语言 只 包含 12 条 基本 指令 。 每 条 指令 都 用 16 
位 编码 ， 由 4 个 十 六 进 制 数字 表示 〔〈 见 图 2-5)。 每 条 指令 的 操作 码 由 前 4 位 组 成 ， 即 等 价 于 第 一 
个 十 六 进 制 数字 。 注 意 〈 见 附录 C)， 这 些 操作 码 用 十 六 进 制 数字 1~C 表 示 。 特 别 是 ， 附 录 C 中 的 表 
说 明 以 十 六 进 制 数字 3 起 始 的 指令 表示 STORE 指令 ， 以 十 六 进 制 A 起 始 的 指令 表示 ROTATE 指 令 。 


操作 的 操作 数 
Dudl LOLO ER 实际 的 位 模式 〈16 仔 3 
| 
3 5 二 六 进 制 形 式 4 个 数字 
图 2-5 ”一 条 指令 的 组 成 〈 附 录 C 描 述 的 计算 机 ) 


在 我 们 演示 用 的 计算 机 中 ， 每 条 指令 的 操作 数字 段 由 3 个 十 六 进 制 数字 〈12 位 ) 组 成 ， 在 每 
种 情况 下 对 操作 码 给 定 的 通用 指令 做 了 进一步 河清 (CHALT 指 令 除 外 , 因为 它 不 需要 进一步 的 规 
定 )。 例 如 ( 见 图 2-6)， 如 果 一 条 指令 的 第 一 个 十 六 进 制 数字 为 3( 存 储 寄存 郁 中 内 容 的 操作 码 力 
那么 该 指令 的 下 一 个 十 六 进 制 数字 则 将 指出 哪个 寄存 器 中 的 内 容 需 要 存储 ， 而 最 后 的 两 个 十 六 
进 制 数字 则 将 指出 由 哪个 存储 单元 接收 该 数据 。 因 此 ， 指 令 35A7 (十 六 进 制 数 ) 翻译 为 “将 第 
5 寄存 中 器 的 位 模式 存储 〈STORE) 到 地 址 为 A7 的 存储 单元 ”。 (注意 ， 使 用 十 六 进 制 记 数 法 是 
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如 何 简化 我 们 的 讨论 的 。 事 实 上 ， 指 令 35A7 是 指 位 模式 0011010110100111.。) 


指令 二 6 3z 


人 


操作 码 3 表 示 把 一 个 寄 
存 器 中 的 内 容 存 储 到 一 
个 和 存 情 单元 中 


操作 数 的 这 部 分 标识 接收 
数据 的 存储 单元 的 地 址 


操作 数 的 这 部 分 标识 哪 
个 寄存 器 的 值 需要 往 依 


图 2-6 ”指令 35A7 的 译 码 


(对 于 主 存储 器 容量 为 什么 以 2z 的 寡 为 度量 单位 ， 指 令 35A7 同 样 提 供 了 一 个 明晰 的 例子 。 由 
于 该 指令 保留 8 位 用 于 指定 该 指令 所 用 的 存储 单元 ， 因 此 能 够 准确 地 引用 守 个 不 同 的 存储 单元 。 
因此 我 们 需要 用 这 么 多 存储 单元 构建 1 个 主 存储 器 一 一 地 址 从 0 到 255$。 如 果 主 存储 器 有 更 多 的 存 
储 单 元 ， 我 们 就 不 能 够 写 出 指令 以 区 别 它 们 ， 如 果 主 存储 器 有 比较 少 的 存储 单元 ， 我 们 写 出 的 
指令 就 可 能 访问 到 不 存在 的 存储 单元 。) 

再 举 一 个 例子 说 明 操 作 数 字段 如 何 立 明 操作 码 给 定 的 通用 指令 。 我 们 来 考虑 一 个 操作 码 为 7 
(十 六 进 制 数 ) 的 指令 ， 它 请 求 将 两 个 寄存 器 的 内 容 进 行 OR (或 ) 运算 。( 在 2.4 节 中 ， 我 们 会 
知道 两 个 寄存 器 的 “或 ”运算 意味 着 什么 。 现 在 我 们 感 兴趣 的 只 是 指令 是 如 何 译 码 的 。) 在 这 种 
情况 下 ， 下 一 个 十 六 进 制 数字 将 指示 存放 运算 结果 的 寄存 器 ， 而 操作 数 最 后 两 个 十 六 进 制 数字 
指示 哪 两 个 寄存 器 要 进行 “或 ” 运算。 因此。 指令 70C5 翻 译 为 “将 寄存 器 C 和 寄存 骼 5 的 内 容 进 
行 “ 或 ”" 运算 ， 并 将 结果 存 和 人 寄存 器 0”。 

我 们 所 讲 的 机 器 的 两 条 LOAD 指 令 存在 细微 的 差别 。 这 里 ， 操 作 码 1〈 十 六 进 制 ) 表示 将 茶 
一 存储 单元 内 容 载 入 寄存 器 的 指令 ， 操 作 码 2 (十 六 进 制 数 ) 表示 一 个 寄存 器 用 一 个 特定 的 值 来 
加 载 。 它 们 的 差别 在 于 ， 第 一 种 类 型 的 指令 操作 数字 段 包含 1 个 地 址 ， 第 二 种 指令 的 操作 数字 段 
包含 了 一 个 要 载 入 的 实际 位 模式 。 

注意 ， 该 机 器 有 两 条 ADD (加 法 ) 指令 ， 一 条 用 于 二 进 制 补 码 记 数 法 表示 的 数 便 相 加 ， 一 
个 用 于 浮 点 记 数 法 表示 的 数值 相 加 。 把 它们 区 分 开 来 的 原因 是 ， 这 两 种 加 法 在 算 林 /到 辑 单元 内 
部 有 不 同 的 实现 步骤 。 

我 们 用 图 2-7 结 束 本 节 ， 图 2-7 把 图 2-2 中 的 指令 编码 为 机 器 语言 。 我 们 已 经 假定 ， 相 加 的 数 
值 以 二 进 制 补 码 记 数 法 形式 存储 在 存储 地 址 6C 和 6D 中 , 其 相 加 的 结果 存放 在 地 址 为 6E 的 存储 单 
元 里 。 


翻 话 
把 地 址 为 6C 的 存储 单元 里 的 位 模式 载 信 寄存 器 5 


把 地 址 为 6D 的 存储 单元 里 的 位 模式 载 信 寄存 器 6 
把 寄存 器 5 和 6 的 内 容 按 二 进 制 补 码 表示 相 加 ， 结 果 存 入 寄存 器 0 


把 寄存 器 0 的 内 容 存 放 到 地 址 为 拭 的 存储 单元 中 
停止 





图 2-7 图 2-2 中 的 指令 的 编码 形式 
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问题 与 练习 

. 对 于 数据 在 计算 机 不 同位 置 之 间 移动 的 运算 ， 使 用 “移动 ” (move) 这 一 术语 为 什么 是 用 词 不 当 ? 

2. 在 本 书 中 ，JUMP 指 令 是 通过 给 出 目的 地 和 名称 〈 或 步 邓 号 ) 的 方法 来 表示 的 【例如 “ 跳 到 步骤 6”) 。 
这 种 方法 的 缺点 是 ， 如 果 一 个 指令 名 称 〔 或 步骤 号 ) 后 来 改变 了 ， 那 么 必须 寻找 所 有 转移 到 该 指令 的 
JUMP 指 令 ， 并 改变 这 些 JUMP 指 令 中 的 目的 地 。 请 另外 设计 一 种 表达 JUMP 指 令 的 方法 ， 使 得 不 需要 
明确 给 出 目的 地 的 名 字 。 

3. 指令 “如 果 0 等 于 0， 那 么 就 转移 到 步骤 7” 是 无 条 件 转移 还 是 条 件 转移 ? 为 什么 ? 

4. 用 实际 的 位 模式 编写 出 图 2-7 中 的 示例 程序 。 

下列 指令 是 用 附录 C 描 述 的 机 器 语言 编写 的 。 请 用 自然 语言 解释 这 些 指 令 ， 

a.368A “ b.BADE c.803C  d40F4 


. 在 附录 CC 描述 的 机 器 语言 里 ， 指 令 15AB 和 25AB 有 什么 区 别 ? 

7. 下 和 面 是 用 具 然 语言 描述 的 一 些 指 令 。 请 把 它们 翻译 为 附录 C 中 描述 的 机 器 语言 ， 

a_ 将 十 六 进 制 数值 S56 装 入 〔〈LOAD) 寄存 器 3 中 。 

b. 将 寄存 器 5 循环 【ROTATE) 右 移 3 位 。 

c. 寡 存 器 A 和 寄存 器 5 与 (AND) ， 并 将 其 结果 存 入 寡 存 器 0 中 。 


1 


司 " 


oa 


< 和 3 和 序 执行 


计算 机 总 是 按照 需要 把 存储 器 里 的 指令 复制 到 CPU 中 来 执行 存储 器 中 的 程序 。 一 旦 指令 到 
达 CPU， 每 个 指令 就 会 被 译 码 及 执行 。 从 存储 器 中 取 指令 的 顺序 与 这 些 指令 存储 在 存 鱼 器 中 的 
顺序 相对 应 ， 除非 遇 到 JUMP 指 令 被 更 改 。 


谁 的 发 明 ? 

将 菜 项 发 明 的 荣誉 授予 个 人 总 是 备 受 争议 。 人 们 将 白 炽 灯 的 发 明 归 功 于 托马斯 . 艾 迪 生 
(Thomas Edison )， 但 是 其 他 研究 员 也 曾 研 制 了 类 似 的 灯泡 ， 从 某 种 意义 上 说 ， 他 只 是 比较 幸 
运 地 获得 了 专利 。 人 们 认为 是 菜 特 (Wright ) 兄弟 发 明 的 飞机 ， 但 他 们 受益 于 其 他 人 的 研究 ， 
在 茶 种 程度 上 ， 他 们 又 被 达 芬 奇 抢 先 了 ， 他 早 在 15 世 纪 就 有 了 玩 玩 飞 行 机 器 的 想法 。 甚至 达 
分 奇 的 设计 看 起 来 也 是 假借 前 人 的 思想 。 当 然 ， 对 于 这 些 发 明 ， 被 认定 的 发 明 人 还 是 有 权 拥 
有 被 授予 的 荣誉 的 。 但 对 于 其 他 一 些 情况 ， 历 史上 的 有 些 荣誉 授予 似乎 是 不 恰当 的 ， 例如 存 
储 程 太 的 概念 。 毫 无 疑问 ， 约 翰 . 冯 : 诺 依 (John von Neumann 壹 一 位 平 越 的 科学 家 ， 
理应 为 自己 的 许多 贡献 获得 荣誉 。 但是， 历史 选择 授予 他 荣誉 的 贡献 是 疹 储 程序 概念 但 这 
一 思想 很 显然 是 由 宾 乡 法 尼 亚 大 学 英 尔 电子 工程 学 院 以 埃 克 特 (于 上 孔 Eckertj 为 前 的 研究 从 员 
提出 的 。 约翰 ， 冯 . 诺 依 野 不 过 是 第 一 个 在 著作 中 转述 这 一 思想 的 人 ， 因此 计 蓝 机 界 选 择 他 
作为 发 明 人 。 

为 了 理解 整个 执行 过 程 如 何 进行 ， 我 们 有 必要 仔细 了 解 一 下 CPU 内 部 的 控制 单元 。 在 这 个 
单元 中 有 2 个 专用 寄存 器 : 指令 寄存 器 (instmuction register) 和 程序 计数 器 (program counter)( 见 
图 2-4)。 指 令 寄存 器 用 于 存储 正在 执行 的 指令 ; 程序 计数 器 包含 下 一 个 待 执行 指令 的 地 址 ， 因 
此 它 用 于 以 机 器 方式 跟踪 程序 执行 到 什么 地 方 。 

CPU 通过 不 断 重 复 执行 一 个 算法 来 完成 其 工作 ， 该 算法 引导 它 完 一 个 称 为 机 器 周期 
《machine cycle) 的 三 步 处 理 。 该 机 器 周期 的 三 个 步骤 分 别 为 取 指 、 译 码 和 执行 《图 2.8)。 在 取 
指 步 又， 控制 单元 根据 程序 计数 器 指定 的 地 址 ， 请 求 主 存储 器 提供 给 它 存放 在 该 地 址 的 指令 。 
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由 于 我 们 的 计算 机 的 每 一 条 指令 长 度 为 2? 个 字 节 ， 所 以 取 指 过 程 需要 从 主 存储 器 中 读 取 2 个 存储 
单元 的 内 容 。CPU 将 读 取 的 指令 存放 在 指令 寡 存 器 中 ， 然 后 将 程序 计数 器 的 值 加 2， 使 得 程序 计 
数 器 就 包含 了 下 一 条 要 执行 的 指令 的 存储 单元 地 址 。 这 时 , 程序 计数 器 为 下 一 次 取 指 做 好 了 准备 。 







1. 根据 程序 计数 器 规定 的 地 


人 入， 然后 增加 程序 计数 器 4 7 En 、 有 2， 对 指令 寄存 器 中 的 位 模式 
的 恒 局 进行 谋 但 








3. 实现 指令 寄存 器 里 指令 所 
定 的 动作 


图 2-8 机 需 周 期 


由 于 指令 现在 已 经 存 入 了 指令 寄存 器 ，CPU 对 该 指令 谋 码 ， 其 中 包括 根据 该 指令 操作 码 要 
求 将 操作 数字 段 分 解 为 适当 的 部 分 。 

然后 ，CPU 激 活 相 应 电路 以 执行 指令 ， 完 成 所 请 求 的 任务 。 例 如 ， 如 果 该 指令 是 从 存储 器 
中 加 载 ，CPU 将 给 主 存储 器 发 送 相应 信号 ， 等 生 其 发 送 数据 ， 再 将 其 存 入 要 求 的 寄存 器 :如果 
该 指令 是 算术 运算 ，CPU 将 激活 算 木 /逻辑 单元 中 相应 的 电路 ， 并 使 用 正确 的 寄存 器 作为 输入 ， 
等 竺 算术 /逻辑 单元 计算 结果 并 将 其 仔 入 相应 的 寄存 疮 。 

一 且 指 令 寄存 器 中 的 指令 执行 完毕 ，CPU 将 又 从 取 指 步骤 开始 下 一 个 机 器 周期 。 注 意 ， 由 
于 程序 计数 器 在 前 一 个 取 指 步 的 最 后 已 经 增加 了 值 , 所 以 它 再 次 为 CPU 提供 了 正确 的 指令 地 址 。 

JUMP 指 令 的 执行 比较 特殊 。 例 如 ， 指 令 B258 〈 见 图 2-9)， 它 的 含义 是 “如 果 寄 存 器 2 的 内 
容 与 寡 存 器 0 的 内 容 相 同 ， 则 跳 转 到 地 址 为 58〈 十 六 进 制 ) 的 指令 ”。 些 时， 该 机 器 周期 的 执行 
步骤 首先 是 比较 寄存 器 2 和 寡人 存 器 0。 如 果 它 们 包括 不 同 的 位 模式 ， 那 么 执行 步 结束 ， 并 开始 下 
一 个 机 器 周期 。 不 过 ， 如 果 这 两 个 寄存 器 内 容 相 同 ， 那 么 机 器 在 执行 此 步骤 时 要 将 数值 38〈 十 
六 进 制 ) 存 和 人 程序 计数 器 里 。 在 这 种 情况 下 ， 下 一 个 读 取 指 令 步骤 发 现 程序 计数 囊 值 为 38， 于 
是 该 地 址 的 指令 将 为 下 一 条 读 取 和 执行 的 指令 。 


尼 人 -| 天 殉 天 下 


光 


操作 码 B 表 示 ， 如 果 指 定 的 
寄存 器 的 内 容 与 寄存 器 0 的 澡 作 数 的 汪 部 分 是 要 庆 
内 容 相同 , 那么 改变 程序 计 | 在 程序 计数 器 中 的 地 二 
数 器 的 人 


操作 数 的 这 部 分 指示 要 与 
寄存 器 0 进行 比较 的 害 存 回 


图 2-9 ”指令 B258 的 译 码 
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注意 ， 如 果 该 指令 为 B058， 那 么 该 程序 计数 器 是 否 需要 更 改 取决 于 害 存 器 0 和 寄存 器 0 的 内 
容 是 否 相同 。 但 是 ， 它 们 是 相同 的 寄存 器 ， 因 此 必然 有 相同 的 内 容 。 于 是 ， 无 论 寄存 器 0 内 容 是 
什么 ， 形 式 为 BOXY 的 指令 都 将 使 存储 位 置 XY 执 行 转移 。 


2.3.1 程序 执行 的 一 个 例子 


让 我 们 从 机 器 周期 的 角度 看 图 2-7 的 程序 是 如 何 执行 的 。 该 程序 从 主 存储 器 中 取出 两 个 值 ， 
计算 它们 的 和 ， 并 将 结果 存储 在 一 个 主 存储 单元 里 。 首 先 我 们 需要 将 该 程序 存放 在 存储 器 的 某 
个 地 方 。 对 于 这 个 例子 ， 假 设 该 程序 存放 在 从 A0 〈 十 六 进 制 ) 开始 的 连续 地 址 中 。 在 按照 这 种 
方法 存放 好 该 程序 后 ， 要 执行 这 个 程序 只 需要 把 该 程序 的 第 一 条 指令 的 地 址 (A0) 存放 在 程序 
计数 器 并 开局 机 器 〈 见 图 2-10)。 





程序 计数 器 包含 
第 一 条 指令 的 地 址 
CPU 主 存储 器 
地 址 单元 
寄存 器 程序 计数 器 A0 四 到 
CE 总 线 及 主 -EC 
】 [1 一 基于 这 二 党 局 故 4 汪 习 程序 存放 在 
六 3 ee 
全 入 村] 而 本 四 电 
了 A4 50) 址 里 
上 5 [SS 
指令 寄存 器 6 FS 
7 上 6 臣 
上 Et 
一 人 
aA9 ER 


图 2-10 图 2-7 中 的 程序 存储 在 主 存储 器 中 准备 执行 


CPU 开始 机 器 周期 的 取 指 步骤 ， 该 步骤 把 存放 在 地 址 A0 的 指令 从 主 存储 器 中 取出 ， 并 将 该 
指令 〈156C) 放 入 指令 寄存 器 里 〈 图 2-1la)。 注 意 ， 在 我 们 的 计算 机 里 ， 指令 的 长 度 为 16 位 〈2 
个 字 节 )。 于 是 ， 要 读 取 的 整个 指令 占用 了 存储 单元 2 个 地 址 ， 即 A0 和 Al。 因此 ，CPU 的 设计 考 


度 到 了 这 点 ， 使 得 取 指 时 能 够 连续 读 两 个 存储 单元 的 内 容 ， 并 将 获得 的 位 模式 存放 在 长 度 为 16 


位 的 指令 寄存 器 。 接 着 , CPU 给 程序 计数 器 加 2, 使 得 该 寄存 器 包含 下 一 条 指令 的 地 址 / 图 2-11b)。 
在 第 一 个 机 器 周期 的 取 指 步骤 结束 时 ， 程 序 计 数 器 和 指令 寄存 器 包含 下 列 的 数据 ， 

程序 计数 器 : A2 

指令 和 寄存器: 156C 

然后 ，CPU 要 分 析 指 令 寄 存 器 中 的 指令 ， 并 得 出 结论 ; 它 要 把 地 址 为 6C 的 存储 单元 的 内 容 
加 载 到 寄存 器 5 中 。 该 加 载 工 作 是 在 机 器 周期 的 执行 步骤 完成 的 ， 接着 CPU 开始 下 一 个 机 器 周期 。 

这 个 周期 首先 要 从 以 地 址 A2 开 始 的 2 个 存储 单元 中 取 指 令 166D 。 CPU 要 将 此 指令 存 入 指令 
寄存 器 ， 并 将 程序 计数 器 增加 为 A4。 因 此 ， 此 时 的 程序 计数 器 和 指令 寄存 器 中 的 值 如 下 ; 

程序 计数 器 : A4 

指令 寄存 器 : 166D 
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程序 计数 器 
地 址 单元 
汪 半 At 医 弄 
指令 寄 他 器 
2 6 | 
及 3 LeDB | 
(al 取 指 步骤 开始 时 ， 取 出 从 地 址 A0 开 始 的 指令 ， 放 在 指令 寄存 器 中 
CPU 主 存储 器 
程序 计数 器 员 
攻击 na 过 
”总线 病症 
指令 寄存 器 二 二 
及 让 ss 语 


(b) 然后 程序 计数 器 增加 ， 使 它 指 向 下 一 条 指令 
图 2-11 执行 机 融 周 期 的 证 取 步 世 


现在 ，CPU 对 指令 166D 进 行 译 码 ， 确 定 它 要 将 地 址 为 6D 的 存储 单元 的 内 容 加 载 到 寄存 器 6， 
然后 执行 该 指令 。 这 时 候 ， 寄 存 器 6 才 真 正 加 载 了 数据 。 


比较 计算 机 能 力 


购买 个 人 电脑 时 通常 用 时 钟 速度 来 比较 计算 机 。 计 算 机 的 上 时钟 (clock ) 是 一 个 称 为 振荡 
器 的 电路 ， 生 成 用 于 协调 计算 机 活动 的 脉冲 一 一 该 振荡 器 电路 生成 脉冲 越 快 ， 则 机 器 周期 速 
度 也 越 快 。 时 钟 速 度 以 赫兹 (缩写 为 Hz ) 为 单位 ，1Hz 相 当 于 每 秒 1 个 周期 (或 脉冲 )。 台 式 
计算 机 比较 殿 型 的 时 钟 周期 是 几 百 MHz ( 较 老 的 型 号 ) 到 几 GHz。( MHz 是 megahertz 的 缩写 ， 
1 MHz=104Hz，GHz 是 gigahertz 的 缩写 ，1 GHz=1000 MHz。) 

不 同 的 CPU 设计 在 一 个 时 钟 周期 里 完成 的 工作 量 是 不 同 的 。 于 是 ， 在 比较 具有 不 同 CPU 
的 计算 机 时 ,单单 用 时 钟 速度 没有 太 大 的 意义 。 如 果 你 在 比较 两 台 计 算 机 ,一 台 德 用 PowerPC 
处 理 器 ， 一 台 使 用 奔腾 处 理 器 ， 那 么 采用 基准 测试 (benchmark ) 来 进行 比较 则 更 有 意 又 。 基 
准 测试 是 指 ， 在 比较 不 同 计 算 机 时 ， 让 它们 执行 同样 的 程序 ( 称 为 基准 四 然后 比较 它们 的 性 
能 。 通 过 选择 代表 不 同类 型 应 用 的 基准 ， 从 这 些 比 较 就 能 够 得 到 对 各 类 市 场 有 意 闵 的 结果 ， 


由 于 该 程序 计数 器 现在 的 值 是 A4, 所 以 CPU 从 这 个 地 址 开始 取 下 一 条 指令 。 于 是 , 指令 5056 
被 放 入 指令 寄存 器 ， 程 序 计数 器 增加 为 A6。 现 在 ，CPU 对 指令 寄存 器 的 内 容 进行 译 码 ， 然 后 激 
活 二 进 制 补 码 加 法 电路 ， 以 寄存 器 $ 和 6 作为 输入 执行 加 法 运算 。 

在 该 执行 步骤 期 间 ， 算 本 /逻辑 单元 执行 所 请 求 的 加 法 运算 ， 将 结果 存 入 寄存 器 0〈 如 控制 
单元 所 要 求 的 那样 )， 然 后 向 控制 单元 报告 它 已 经 完成 了 任务 。 然 后 CPU 开始 另 一 个 机 器 丑 期 ， 
再 一 次 借助 程序 计数 器 ， 它 从 以 地 址 A6 开 始 的 2 个 存储 单元 中 取 下 一 条 指令 (306E)， 然 后 将 程 
序 计 数 器 增加 到 A8， 接 着 译 码 并 执行 该 指令 。 此 时 ， 和 已 经 放 在 了 存储 单元 6E。 
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下 一 条 指令 从 存储 单元 A8 开 始 读 取 ， 同 时 程序 计数 器 加 到 AA。 指 令 寄 存 器 〔C000) 的 内 
容 现在 译 码 为 停止 指令 。 因此， 机 器 在 该 机 器 周期 的 执行 步 处 停止 ， 程 序 完成 。 

概括 地 说 ， 如 果 我 们 遵照 程序 详细 的 指令 列表 ， 那 么 一 个 存放 在 存储 器 里 的 程序 的 执行 过 
程 就 如 同 你 我 都 可 以 做 的 那样 。 我 们 可 以 通过 标记 指令 来 确定 执行 到 的 位 置 ， 而 CPU 则 利用 程 
太 计 数 器 来 确定 执行 到 的 位 置 。 在 确定 下 一 步 要 执行 什么 指令 后 ， 我 们 需要 读 该 指令 并 分 析 它 
的 含义 。 然 后 ， 实 现 所 请 求 的 任务 并 返回 到 指令 的 列表 ， 为 下 一 条 指令 做 准备 ， 同 样 ， 计 算 机 
也 一 样 ， 它 执行 指令 寄存 器 中 的 指令 ， 然 后 从 另 一 个 取 指 步骤 开始 继续 进行 。 


2.3.2 程序 与 数据 


许多 程序 可 以 同时 存储 在 计算 机 的 主 存储 器 里 ， 只 要 它们 的 地 址 不 同 。 开 户 计 算 机 时 运行 
哪个 程序 可 以 通过 适当 地 设置 程序 计数 器 的 值 来 决定 。 

然而 ， 我 们 必须 记 住 : 数据 也 存储 在 主 存储 器 中 ， 也 用 0 和 1 来 编码 ， 所 以 计算 机 自己 无 法 
知道 哪 是 数据 ， 哪 是 程序 。 如 果 程 序 计 数 器 被 赋予 了 数据 的 地 址 而 非 所 希望 的 程序 的 地 址 ， 那 
么 在 没有 更 好 选择 的 情况 下 ， 该 CPU 会 像 取 指令 一 样 读 取 此 数据 的 位 模式 ， 并 执行 。 最 终 的 结 
采取 决 于 该 数据 。 

然而 ， 我 们 不 应 该 就 此 得 出 结论 : 将 程序 和 数据 以 相同 的 形式 存 入 计算 机 的 存储 器 是 错误 
的 。 事 实 上 ， 这 已 经 被 证 明 是 一 个 有 用 的 特性 ， 因 为 它 使 得 某 一 个 程序 可 以 操纵 其 他 程序 〈 其 
全 征 目 己 )， 就 像 它 可 以 操纵 数据 一 样 。 例 如 ， 假 设 有 这 样 的 一 个 程序 ， 它 可 以 根据 其 与 环境 的 
交互 而 月 我 修正 ， 因 此 展现 了 它 学 习 的 能 力 ， 亦 或 者 有 这 样 一 个 程序 ， 它 可 以 编写 及 执行 其 他 
程序 ， 以 解决 它 所 遇 到 的 问题 。 


问题 与 练习 
1 人 鼻 设 在 附录 C 描 述 的 计算 机 中 ， 从 地 址 00 到 05 的 存储 单元 中 包含 下 列 “ 十 六 进 制 ) 他 模式 : 
地 址 内 容 
0 匹 ， 
心 ] 日 避 
天。 3 本 
人 3 【7 
【 导 可 
0 站 站 


如 果 有 启动 计算 机 时 ， 程 序 计数 器 设 为 00， 那 么 该 计算 机 停止 时 ， 地 址 为 17《〈 干 去 进 剩 亲 的 蚕 桩 单元 里 
会 有 什么 样 的 位 模式 ? 
2 你 设 在 附录 C 描 述 的 计算 机 中 ， 从 地 址 B0 到 B8 的 存储 单元 中 包含 下 列 《 于 六 进 制 》 伺 模 式 : 


地 址 内 容 
了 | 
| 且 间 
再。 上 岂 j 
及 3 02 
Bi 33 
了 B5 了 8 
Be 和 
下 7 U 
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na 如果 程序 计数 器 从 B0 和 启动， 执行 第 一 条 指令 之 后 ， 存 储 在 寄存 器 3 中 的 位 模式 是 什么 ? 
b， 在 执行 停止 指令 时 ， 存 人 情 单 元 B8 里 的 位 模式 是 什么 ? 
3 假设 在 附录 C 描 述 的 计算 机 中 ， 从 地 址 A4 到 B1 的 存储 单元 中 包含 下 列 〈 十 六 进 制 ) 世 横 式 : 


地 址 内 容 
各 引 20 
入 5 D0 
A6 21 
A7 03 
AS 22 
入 9 01 
各 由 Bl 
AA B0 
AC 50 
AD 02 
AE BO 
AF AAA 
B0 CO 
Bi 00 


谨 计 算 机 启动 时 程序 计数 器 含有 值 A4， 回 答 人 
8a， 地 址 为 AA 的 指令 第 一 次 拔 行 时 ， 寄 存 器 0 中 是 什么 
hb 地址 为 AA 的 指令 第 二 次 执行 时 ， 寄 存 器 0 中 是 什么 
c. 该 计算 机 停止 之 前 ， 存 放 在 地 址 AA 里 的 指令 执行 了 多 少 次 ? 
4. 假设 在 附录 C 描 述 的 计算 机 中 ， 从 地 址 FEO 到 F9 的 存储 单元 中 包含 下 列 〔〈 十 六 进 制 ) 位 模式 : 


地 址 内 容 
EU 20 
Fl CO0 
F2 划 
F3 FS 
F4 20 
ES 00 
FE6 训 
F7 F9 
FS FF 
F9 FF 


如 果 启 动 计算 机 时 程序 计数 器 含有 值 F0， 当 到 达 地 址 为 FE8 的 指令 时 ， 该 计算 机 在 执行 什么 ? 


站 im 站 站 mm 昌  - em 严 
站 5 3 


2.4 2.4 ”算术 /逻辑 指令 


如 前 所 述 ， 算 本 /逻辑 指令 组 由 算术 、 交 和 辑 、 移 位 等 运算 指令 组 成 。 在 本 蔬 中 ， 我 们 将 许 细 
介绍 这 些 运算 。 
2.4.1 至 辑 运 算 


第 1 章 介 绍 了 逻辑 运算 AND 〈 与 )、OR 〈 或 ) 和 XOR《〈 弄 或)， 它 们 都 是 二 进 制 的 运算 ， 
组 合 两 个 输入 的 二 进 制 位 ， 得 到 一 个 输出 的 二 进 制 位 。 这 些 运 算 可 以 扩展 成 为 这 样 的 运算 ， 


2.4 算 林 /还 辑 指 令 63 
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合 两 个 二 进 制 位 串 产 生 一 个 二 进 制 位 串 输出 ， 只 需要 把 上 述 基 本 运算 应 用 到 每 一 列 。 例 如 ， 位 
模式 10011010 与 11001001 进 行 与 (AND) 运算 所 得 结果 如 下 ; 
10011010 


AND 11001001 
10001000 


这 里 ， 我 们 只 是 在 每 一 列 上 将 两 个 二 进 制 位 进行 AND 的 结果 作为 结果 。 同 理 ， 将 这 些 位 模式 进 
行 OR 运 算 及 XOR 运 算 时 得 到 ， 


二 局 吕 上 工 性 工 改 10011010 
DR 1 1001001 愉 WR LU001001 
了 了 工 曝 工 忆 1 工 01010011 


AND 运 算 的 一 个 主要 用 途 是 将 位 模式 的 一 部 分 设 为 0， 而 不 影响 另外 一 部 分 。 例 如 ， 如 果 
字 节 00001111 是 AND 运 算 的 第 一 个 操作 数 ， 那 么 会 产生 什么 结果 ? 即使 不 知道 第 二 个 操作 数 的 
内 容 ， 我 们 仍然 能 够 得 出 结论 ， 结 果 的 最 高 4 位 均 为 0。 其 次 ， 结 训 的 最 低 4 位 将 与 第 二 个 操作 数 
的 最 低 4 位 相同 ， 如 下 所 示 ; 
uUuob01111 
AND 10101010 
U0001010 
AND 运 算 的 这 个 应 用 是 一 个 称 为 屏 若 (masking ) 的 过 程 的 例子 。 这 里 , 一 个 称 为 掩 码 (mask) 
的 操作 数 决 定 另 一 个 操作 数 的 哪个 部 分 会 影响 结果 。 在 这 个 AND 运 算 中 ， 屏蔽 得 出 的 结果 为 ， 
其 中 一 部 分 是 一 个 操作 数 的 复制 品 ， 而 没有 复制 的 部 分 为 0。 
此 类 运算 在 操作 一 个 位 图 〈bit map) 时 很 实用 。 位 图 是 由 若干 二 进 制 位 组 成 的 串 ， 其 中 每 个 
位 表示 一 个 特定 对 象 存 在 与 否 。 在 讨论 图 像 表示 的 时 候 已 经 涉及 位 图 ， 那 时 每 一 位 是 与 一 个 像素 
相 联 系 的 。 再 举 一 例 ， 一 组 由 52 位 组 成 的 串 ， 其 中 每 个 位 与 一 张 特定 的 扑克 牌 相 联 系 ， 那么 此 位 
串 可 以 用 于 表示 一 手 5 张 牌 ， 我 们 只 需要 将 1 赋予 和 手中 牌 相 对 应 的 5 个 位 ， 而 将 0 赋予 其 他 位 。 同 
理 ，13 个 位 为 1 的 $2 位 位 图 可 以 表示 一 手 桥牌 ， 32 位 位 图 可 以 表示 32 种 口味 的 冰激凌 哪些 是 有 的 。 
接着 ， 假 设 一 个 8 位 存储 单元 被 用 作 一 个 位 图 ， 我 们 希望 查 明 与 从 高 位 位 算 起 的 第 3 位 相 联 
系 的 对 象 是 否 存在 ? 我们 只 需要 将 整个 字 节 与 掩 码 00100000 进 行 AND 操 作 ， 当 且 仅 当 该 位 图 从 
吉 位 端 算 起 的 第 3 位 本 身 为 0 时 ， 结 果 的 字 节 值 全 为 0。 于 是 ， 在 该 AND 运 算 中 安排 一 个 条 件 移 
位 指令 ， 程 序 就 可 以 实现 相应 的 动作 。 其 次 ， 如 果 该 位 图 从 高 位 算 起 的 第 3 位 为 1， 我 们 想 在 不 
破坏 其 他 位 的 情况 下 将 其 改 为 0, 那么 可 以 把 该 位 图 与 掩 码 11011111 进 行 AND 操 作 ， 然后 用 结果 
从 代 原来 的 位 模式 。 
AND 运 算 可 用 于 复制 一 个 串 的 一 部 分 ， 而 在 不 复制 的 部 分 置 为 0， 而 OR 运 算 也 可 用 于 复制 一 
个 串 的 一 部 分 ， 但 在 不 复制 的 部 分 置 为 1。 为 此 ， 我 们 再 次 使 用 掩 码 ， 但 是 这 次 我 们 用 0 来 指示 要 
复制 的 位 的 位 置 ， 用 1 指示 不 复制 的 位 置 。 例 如 ， 将 任何 字 节 和 11110000 进 行 OR 运 算 ， 结果 产生 
的 位 模式 最 高 有 效 的 4 位 为 1， 而 剩余 位 则 是 另外 一 个 操作 数 最 低 有 效 4 位 的 复制 ， 如 下 所 示 : 
11L110000 
oOR_ 110101010 
41010 
办 此 , 掩 码 11011111 参 与 AND 运 算 可 以 使 得 一 个 8 位 位 图 最 高 起 第 3 位 一 定 变 为 0, 而 掩 码 00100000 
可 以 参与 OR 运 算 而 使 得 同样 的 位 置 变 为 1。 
XOR 运 算 的 一 个 主要 用 途 是 形成 一 组 位 串 的 反 码 。 将 任意 一 个 字 节 与 全 部 为 1 的 掩 码 进行 
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XOR 运 算 可 以 得 到 该 字 节 的 反 码 。 例 如 ， 注 意 下 面 示 例 中 第 二 个 操作 数 与 其 结果 的 关系 : 


二 | 工 工 工 工 工 工 
闪避 及 昌 电 于 日 
01010101 


在 附录 C 描 述 的 计算 机 语言 中 ， 操 作 码 7、8 和 9 分 别 用 于 逻辑 OR、AND 和 XOR。 每 个 操作 
码 要 求 在 指定 的 2 个 寄存 器 内 容 之 间 进 行 相 应 的 逻 辑 运 算 ， 并 将 结果 存放 在 另 一 个 指定 的 寡 存 
器 ， 例 如 ， 指 令 7ABC 要 求 的 是 : 将 寄存 器 B 和 C 的 内 容 进 行 OR 运 算 ， 并 将 结果 存放 在 寄存 器 A。 


2.4.2 ”循环 移 位 及 移 位 运算 


循环 及 移 位 运算 提供 了 将 一 个 寄存 器 内 的 二 进 制 位 进行 移动 的 手段 , 常用 于 解决 对 齐 问 题 。 
这 些 运 算 根据 移动 方向 〈 向 右 或 向 左 ) 和 其 过 程 是 否 循 环 来 分 类 。 这 些 分 类 准则 的 混合 使 用 产 
生 了 许 许多 多 变 体 。 下 面 我 们 简单 介绍 一 下 所 涉及 的 概念 。 

我 们 来 考虑 售 一 个 字 节 二 进 制 位 的 寄存 器 。 如 果 我 们 将 其 内 容 向 右 移 一 位 ， 则 最 右边 的 位 
落 到 了 边界 以 外 ， 最 左 端 出 现 了 一 个 空位 。 对 于 这 个 移出 的 位 及 留 出 的 空位 如 何 操作 是 区 别 各 
种 移 位 运算 的 特征 。 一 种 方法 就 是 将 右 侧 移出 的 位 放置 在 左 端的 空位 上 ， 这 类 运算 称 为 循环 移 
位 《circular shift 或 rotation)。 因 此 ， 如 果 我 们 针对 一 个 字 节 的 位 模式 向 右 进行 8 次 循环 移 位 ， 则 
所 得 位 模式 与 初始 形式 相同 。 

另外 一 种 方法 就 是 丢弃 移出 边界 的 位 , 并 用 0 填充 空位 , 这 类 运算 称 为 逻辑 移 位 (logical shift)。 
这 种 向 左 的 移 位 可 以 用 2 和 屁 以 二 进 制 补 码 表示 。 因 为 ， 二 进 制 数字 左 移 相当 于 乘 2， 类 似 于 对 一 个 
十 进 制 数字 左 移 就 相当 于 乘 10。 此 外 ， 除 2 运算 可 以 通过 二 进 制 位 石 移 来 完成 。 无 论 对 于 哪 种 移 
位 ， 在 使 用 某 种 记 数 法 系统 时 ， 都 一 定 要 小 心地 保留 符号 位 。 因 此 ， 右 移 时 留 出 的 空位 〈 符 号 位 
位 置 ) 总 是 用 它 原来 的 值 来 填 。 保 留 符 号 位 不 变 的 移 位 称 为 算术 移 位 (arithmetic shift )。 

在 各 种 可 能 的 移 位 和 循环 移 位 指令 中 ， 附 录 C 描 述 的 机 器 语言 仅 包 括 一 条 右 循环 物 位 指 
令 ， 操 作 码 为 A。 在 这 个 移 位 运算 中 ， 操 作 数 的 第 一 个 十 六 进 制 数 字 指 定 了 要 循环 移 位 的 寄存 
器 ， 操 作 数 的 其 余部 位 规定 要 循环 移 位 的 位 数 。 因 此 ， 指 令 A501 意 为 “将 寄存 器 5 的 内 容 循 环 
右 移 1 位 ” 尤其 ， 如 果 寄 存 器 5 最 初 包含 有 位 模式 65〔〈 十 六 进 制 )， 那 么 执行 此 指令 〈〔 兄 图 2-12) 
后 将 包含 B2。( 演 试 一 下 如 何 使 用 附录 C 描 述 的 机 器 语言 提供 的 指令 组 合 来 产生 其 他 移 位 及 循环 
移 位 指令 .例如 ,因为 一 个 寄存 器 的 长 度 为 8 位 ,所 以 循环 右 移 3 位 与 循环 左 移 $ 位 所 得 结果 一 样 。.) 


各 位 向 右 移 1 位 ， 最 右边 
的 位 “ 称 出 ”了 ,把 它 填 
在 号 一 病 的 空位 上 





1T10110 0 1 0 最 终 位 模式 
图 2-12 ”将 位 模式 65 (十 六 进 制 ) 向 右 循环 转移 1 位 
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2.4.3 ”算术 运算 


尽管 我 们 已 经 提 到 过 算术 运算 一 加 、 减 、 乘 和 除 ， 但 还 需 饶 舌 几 句 。 首 先 ， 我 们 知道 减 
法 运算 可 以 通过 加 法 及 取 负 来 模拟 。 此 外 ， 乘 法 只 不 过 就 是 反复 进行 加 法 运算 ， 除 法 就 是 反复 
进行 减法 运算 。(6 可 以 减 去 3 个 2， 所 以 6 除 以 2 为 3。) 因此 ， 一 些小 型 CPU 都 只 装 有 加 法 指令 或 
者 加 法 和 减法 指令 。 

我 们 还 应 该 注意 到 ， 每 种 算术 运算 都 有 许多 的 变 体 。 对 于 附录 C 描述 的 机 器 语言 里 使 用 的 
加 法 运算 ， 已 经 暗示 了 这 一 点 。 例 如 ， 对 于 加 法 运算 ， 如 果 相 加 的 数值 用 二 进 制 补 码 记 数 法 存 
储 ， 此 加 法 过 程 的 实现 就 一 定 是 每 列 数字 直接 相 加 :， 然而， 如 果 操 作 数 用 浮 点 记 数 法 存储 ， 加 
法 过 程 则 为 ， 读 取 每 个 操作 数 的 尾数 ， 根 据 指数 字段 将 其 向 左 或 右 移 位 ， 检 查 符号 位 ， 实 现 加 
法 ， 最 后 将 其 结果 翻译 成 浮 点 记 数 法 。 因 此 ， 尽 管 它 们 都 是 加 法 运算 ， 但 是 计算 机 实现 的 过 程 
并 不 相同 。 


问题 与 练习 
1， 完 成 指定 的 运算 。 
3， 口 工 怠 昌 1 1] bb， 工人 日 站 0 虽 1 1 : 昌 上 全 定 和 
总 有 册 遇 业 局 局 MD 11 总. NID 0 duwl 
几 . DO1L6001011 马 . 10000011 上 条 轨 秆 二 页 沿 吕 
口 及 1 1 和 1011 后 及 下 口 民 日 全 工 上 Tb 
， 日 工 日 荆 遇 工 工 h. 了 站 总 操 吕 总 二】 1. | 峙 吴语 全 人 
XOR 10101011 OOR 11T 00OD 世 站 已 明 Tb1101l 


2. 假如 想 从 一 个 字 节 中 分 离 出 中 间 的 4 位 ; 将 其 他 4 个 位 设 为 0 ， 却 不 于 扰 中 间 的 4 位 。 请 问 必 须 使 用 什 
么 掩 码 及 什么 运算 ? 
3. 假如 想 把 一 个 字 节 的 中 间 4 位 取 反 码 ， 其 他 4 位 保持 不 变 。 请 问 必 须 使 用 什么 掩 码 及 什么 运算 ? 
4.a. 假如 想 将 一 组 位 串 的 前 2 位 进行 XOR 运 算 ， 然 后 以 下 列 方式 秋 续 于 去 ， 把 上 次 计算 结果 与 位 串 的 下 
一 个 位 进行 XOR 运 算 。 请 问 最 后 的 计算 结果 与 该 串 中 1 的 个 数 有 什么 甘 系 ? 
b, 在 编码 一 个 报 文 时 ， 和 需要 确定 使 用 什么 样 的 奇偶 校 验 位 ， 问 题 a 与 此 问题 有 什么 联系 ? 
5. 通常 使 用 到 辑 运算 代替 数值 运算 是 很 方便 的 。 例 如 ， 到 辑 运算 AND 将 两 个 位 组 人 台 的 方法 同 乘法 运算 
一 样 。 哪 一 种 逻辑 运算 和 两 个 位 的 加 法 几乎 相同 ， 这 样 情况 下 会 导致 什么 错误 发 生 ? 
6. 将 ASCII 人 得 中 的 小 写字 母 变 为 大 写字 母 ， 请 问 需 要 使 用 什么 逻辑 运算 和 什么 掩 码 ? 大 写字 母 变 小 写 允 


如 何 ? 
7. 在 下 列 位 串 中 ， 完 成 循环 右 移 3 位 会 得 到 什么 绪 果 ? 
a. 01101010 00gaie till 
8 对 于 下 面 用 十 六 进 制 表示 的 池 节 ， 执 行 箱 环 堪 移 1 位 的 运算 ， 络 果 是 什么 ? 用 十 关 进 制 形 式 给 出 你 . 
的 管 案 。 
a.AB  b.SC c.B7 d. 35 


一 组 8 位 位 串 自 环 右 移 3 位 等 价 于 循环 左 移 和 多 少 位 ? 

10. 如 果 位 模式 01101010 与 11001100 是 以 二 进 制 霜 码 记 数 法 表示 的 值 ， 请 问 和 它们 的 和 的 位 模式 是 什么 ? 
如 果 这 两 个 位 模式 是 用 第 1 章 人 那么 阅 果 又 是 什么 ? 

11. 使 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 : 它 将 地 址 为 A7 的 存储 单元 的 最 高 有 效 位 设 为 1， 叙 不 影响 ， 
其 他 位 的 值 

_ 12. 使 用 附录 C 摘 述 的 机 器 语言 编写 一 个 程序 : 它 将 存储 单元 E0 的 中 间 4 位 复制 到 存储 单元 El 中 的 最 低 4 

己 ， 并 将 存 情 单元 El 的 最 4 位 置 为 0。 


-一 一 
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主 存储 器 和 CPU 构成 了 计算 机 的 核心 。 本 节 将 研究 这 个 核心 【将 称 为 计算 机 ) 是 如 何 导 外 
围 设备 通信 ， 如 海量 存储 系统 、 打 印 机 、 键 盘 、 鼠 标 、 监 视 器 、 数 码 相 机 以 及 其 他 计算 机 。 


2.5.1 ”控制 器 的 作用 


计算 机 与 其 他 设备 的 通信 通常 是 通过 称 为 控制 器 〈controller) 的 中 间 设 备 来 处 理 的 。 对 于 
个 人 计算 机 ， 控 制 器 可 能 由 永久 安装 在 其 主板 上 的 电路 组 成 ， 或 者 为 了 灵活 ， 它 会 采用 电路 板 
的 形式 插入 主板 的 插 模 中。 无 论 哪 种 形式 ， 控 制 器 都 是 通过 电线 与 计算 机 箱 里 的 外 围 设备 相连 
接 的 ， 或 者 与 计算 机 背面 称 为 端口 《port) 的 连接 器 相连 接 ， 其 他 外 围 设备 可 以 揪 到 这 些 端 口 
上 上。 这 些 控制 器 有 时 候 本 身 就 是 小 型 计算 机 ， 每 个 都 有 上 自己 的 存储 电路 和 简单 的 CPU， 可 以 实 
现 指挥 该 控制 器 活动 的 程序 。 

控制 器 将 信息 和 数据 来 回 地 在 两 种 形式 之 间 转 换 : 一 种 是 与 计算 机 内 部 特征 相 适 应 的 形式 ， 
另外 一 种 与 所 连接 外 围 设 备 相符 的 形式 。 最 初 ， 每 个 控制 器 都 是 为 特定 类 型 的 设备 设计 的 。 因 
此 ， 购 买 一 种 新 的 外 围 设 备 常常 也 就 需要 同时 购买 一 个 新 控制 器 。 

最 近 ， 人 大 们 已 经 开始 在 个 人 电脑 领域 开发 标准 ， 例 如 USB 〈universal serial bus， 通 用 串 行 
总 线 ) 和 FireWire 〔〈 火 线 )， 这 样 一 个 控制 器 就 可 以 处 理 多 种 设备 。 例 如 ， 一 个 USB 控 制 器 可 以 
用 作 计 算 机 与 其 他 任何 同 USB 兼 容 系 列 设备 的 接口 。 现 在 市 场 上 可 以 与 USB 控 制 器 通信 的 设备 
包括 鼠标 、 打 印 机 、 扫 描 仪 、 海 量 存储 设备 以 及 数码 相机 。 

每 一 个 控制 器 通过 连接 到 相同 的 总 线 〈 该 总 线 用 来 连接 计算 机 的 CPU 和 主 存 ) 完成 与 计算 
机 的 通信 (图 2-13)。 由 于 这 种 连接 , 每 个 控制 器 能 够 监控 CPU 与 主 存储 器 之 间 正 在 发 送 的 信和 号 ， 
也 可 以 将 自己 的 信号 插入 总 线 . 

CD 虹 动 几 喇 制 解 再 艇 


控制 器 控制 器 


| 总 线 | 
CPU 本 站 主 存储 器 


控制 昔 控制 器 


临 视 虎 磁盘 驱动 器 
图 2-13 ”连接 到 计算 机 总 线 的 控制 器 


USB 与 FireWire 


USB (通用 串 行 总 线 ) 和 FireWire (火线 ) 是 标准 化 的 串 行 通信 系统 ， 它 简化 子 络 个 人 
电脑 添加 外 围 设 备 的 过 程 。USB 由 英特尔 公司 主导 研发 ，FireWire 则 由 蔷 果 公司 主导 研发 
两 者 的 目的 都 是 通过 一 个 控制 器 提供 外 部 端口 ， 并 用 该 端口 来 连接 许多 外 围 设 备 。 在 该 设置 
中 ， 控 制 器 和 将 计算 机 内 部 信号 特征 转 摘 成 相应 的 USB 或 FireWire 标 准 人 信号， 反之， 为 了 与 控 
制 器 的 通信 ， 与 控制 器 相连 接 的 每 个 设备 都 将 其 内 部 特性 转换 成 相同 的 USB 或 FireWire 标 准 ， 
于 是 ， 给 PC 添加 新 设备 就 再 不 需要 增加 新 的 控制 器， 只 需要 在 USB 端 口 或 FireWire 端 口 播 入 
分 别 与 其 养 容 的 设备 .。 
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对 比 而 言 ，FireWire 的 传输 速率 更 高 ， 但 是 USB 技 术 成 本 低 ， 因 此 在 低 消 费 大 众 市 场 令 
域 占 据 突 出 地 位 。 现 在 市 场 上 养 容 USB 的 设备 有 和 鼠标、 键盘 、 打印 机 、 扫 描 仪 、 数 码 相 机 以 
及 为 备份 应 用 设计 的 海量 存储 系统 。FireWire 应 用 趋向 于 集中 在 需要 更 高 传输 违 率 的 设备 上 。 
例如 摄像 机 以 及 联机 海量 存储 系统 ， 


通过 这 种 安排 ，CPU 能 够 以 它 与 主 存储 器 通信 的 相 辣 方式 与 连接 在 总 线 上 的 控制 器 进行 通 
信 。 为 了 发 送 一 个 位 模式 给 控制 器 ， 该 位 模式 首先 要 在 CPU 的 一 个 通用 寄存 器 中 构建 ， 然 后 ， 
由 CPU 执行 一 个 类 似 STORE 指 令 的 指令 ， 将 该 位 模式 “存储 ”到 控制 器 。 类 似 地 ， 当 要 从 一 个 
控制 器 接收 一 个 位 模式 时 ， 要 使 用 一 条 类 似 LOAD 指 令 的 指令 。 

在 某 些 计算 机 的 设计 中 ， 通 过 控制 器 的 数据 传输 〈 输 入 与 输出 ) 直接 使 用 LOAD 和 STORE 
操作 码 〈 虽 然 这 些 操作 码 已 经 用 于 同 主 存储 器 的 通信 )。 在 这 种 情况 下 ， 每 个 控制 器 被 设计 为 响 
应 唯一 一 组 地 址 的 引用 ， 而 主 存储 器 被 设计 成 忽略 对 这 些 地 址 的 引用 。 因 此 ， 当 CPU 在 总 线 上 
发 送 一 条 消息 ， 要 把 一 个 位 模式 存储 到 一 个 分 配给 某 个 控制 器 的 存储 器 地 址 时 ， 这 个 位 模式 实 
际 上 是 存储 到 该 控制 器 中 ， 而 不 是 主 存储 器 中 。 同 理 ， 如 果 CPU 试 图 从 这 样 的 存储 器 地 址 接收 
数据 〔 如 LOAD 指 令 )， 那么 它 所 接收 到 的 位 模式 将 来 自控 制 器 而 不 是 存储 器 。 这 样 的 通信 系 续 
称 为 存储 映射 输入 /输出 (memory-mapped IO )， 因为 该 计算 机 的 输入 /输出 设备 好 像 是 在 各 种 存 
储 器 位 置 里 〈 图 2-14)。 


总 线 “站 二 主 称 
CR 储 器 


一 器 - 控制 器 外围 设备 
图 2-14 存储 映射 输入 /输出 的 概念 表示 


妃 外 一 种 存储 器 映射 输入 /输出 的 方法 是 在 机 器 语言 中 提供 特定 的 操作 码 ,用 以 规定 通过 控 
制 器 的 数据 传输 〈 输 入 与 输出 )。 具 有 这 些 操作 码 的 指令 称 为 DO 指令 。 例 如 ， 如 果 附 录 C 中 描述 
的 机 器 语言 遵循 这 种 方法 ， 它 则 要 包括 诸如 F5A3 这 样 的 一 条 指令 ， F5A3 指 的 是 “将 寄存 器 5 的 
内 容 存 储 在 由 位 模式 A3 指 定 的 控制 器 ” 


2.5.2 直接 内 存 存 取 


因为 控制 器 是 连接 到 一 台 计 算 机 的 总 线 上 的 ， 因此 它 就 有 可 能 在 CPU 不 使 用 总 线 的 几 纳 秒 
时 间 里 实现 它 与 主 存储 器 的 通信 。 控制 器 这 种 存 取 主 存储 器 的 能 力 称 为 直接 存储 器 存 取 〈direct 
memory access，DMAJ)， 可 以 极 大 地 提高 计算 机 的 性 能 。 例 如 ， 要 从 磁盘 一 个 扇 区 读 取 数据 ， 
CPU 可 以 将 编码 为 位 模式 的 请 求 发 送 给 连接 这 个 磁 表 的 控制 器 ， 归 求 该 控制 器 读 取 这 个 扇 区 ， 
并 将 数据 存储 在 指定 的 一 块 主 存储 器 区 域 中 。 在 该 控制 器 执行 此 读 操 作 并 通过 DMA 将 数据 存储 
在 主 存储 器 时 ，CPU 可 以 继续 执行 其 他 任务 。 于 是 ， 这 两 个 活动 会 同时 执行 ， CPU 将 执行 某 个 
程序 ， 而 控制 器 则 监视 磁盘 与 主 存储 器 之 间 的 数据 传输 。 这 样 ， 在 相对 缓慢 的 数据 传输 过 程 中 ， 
CPU 的 计算 资源 就 不 会 被 浪费 。 

使 用 DMA 同 样 也 有 不 利 影响 ， 使 计算 机 总 线 的 通信 复杂 化 。 位 模式 必须 在 CPU 与 主 存储 器 
之 间 、 CPU- 与 每 个 控制 器 之 间 以 及 每 个 控制 器 与 主 存储 器 之 间 进 行 传送 。 协调 总 线 所 有 这 些 活 
动 是 个 很 大 的 设计 难题 。 而 且 即 使 设计 非常 出 色 ， CPU 与 控制 器 竞争 总 线 存 取 时 ， 中 央 总 线 也 
可 能 成 为 障碍 。 此 障碍 称 为 冯 ' 诺 依 虹 瓶 颈 (von Neumann bottleneck )， 因为 它 是 源 于 冯 . 诺 依 
曼 体 系 结构 〈von Neumann architecture) 的 结果 ， 在 该 结构 中 ， CPU 是 通过 中 央 总 线 从 主 存 
悄 髓 取 指 的 。 


多 
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2.5.3 ”握手 


两 个 计算 机 部 件 之 间 的 数据 传输 很 少 是 单 向 进行 的 。 即 使 我 们 可 以 把 打印 机 看 作 是 接收 数据 
的 设备 ， 但 事实 上 它 也 向 计算 机 发 送 数据 。 毕 竟 ， 计 算 机 产生 字符 并 内 打印 机 发 送 字符 的 速度 要 
远 远 快 于 打印 机 能 够 打印 的 速度 。 如 果 计 算 机 盲目 地 把 数据 发 送 给 打印 机 ， 那 么 打印 机 很 快 就 落 
在 后 面 了 ， 结 果 是 使 数据 丢失 。 因 此 ， 诸 如 打印 文件 这 样 的 过 程 都 会 包括 持续 的 双 癌 对 话 ， 寺 算 
机 和 外 围 设备 之 间 灾 换 设备 状态 的 信息 , 协调 它们 之 间 的 活动 。 这 个 过 程 称 为 握 于 (handshaking )。 

握手 通常 涉及 一 个 状态 字 (status word)， 和 它 是 由 外 围 设备 生成 并 发 送 给 控制 器 的 一 个 位 模 
式 。 该 状态 字 是 一 个 位 图 ， 其 中 的 各 个 二 进 制 位 反映 了 了 谦 设 备 的 各 种 状态 。 以 打印 机 为 例 ， 其 
状态 字 的 最 低 有 效 位 数值 可 以 表示 该 打印 机 是 否 缺 纸 ， 而 下 一 个 位 可 以 表示 该 打印 机 是 否 已 经 
淮 备 好 再 接收 数据 ， 另 外 还 有 一 位 用 于 指出 是 否 卡 纸 。 控制 器 是 目 己 啊 应 这 些 状态 信息 ， 还 是 
由 CPU 来 处 理 ， 这 取决 于 不 同 的 系统 。 无 论 哪 种 情况 ， 状 态 字 都 提供 了 一 种 机 制 ， 用 于 完成 与 
外 围 设备 的 通信 。 


2.5.4 流行 的 通信 媒介 


计算 设备 之 间 的 通信 由 两 种 途径 处 理 : 并 行 及 串 行 。 这 些 术 语 指 的 是 信号 之 间 传 输 的 方式 。 
并 行 通 信 (parallel communication) 指 的 是 若干 位 同时 传输 ， 每 个 位 都 在 各 自 的 “线路 ”上 。 这 
种 技术 数据 传输 快 ， 但 是 需要 相对 复杂 的 通信 通路 。 例 如 计算 机 内 部 总 线 ， 多 条 线路 被 用 于 同 
时 传输 大 量 数据 块 及 其 他 信号 。 此 外 ， 大 多 数 PC 机 都 至 少 安装 一 个 “并 行 端口 ” 这 样 ， 数 据 
就 可 以 每 次 8 位 地 从 计算 机 输入 或 输出 。 

与 此 相反 ， 串 行 通信 (serial communication ) 基于 在 一 条 信和 号 线 上 一 个 信和 号 接 一 个 信号 地 
传输 。 相 对 于 并 行 通信 ， 串 行 通信 和 只 需要 一 条 简单 的 数据 路 径 ， 这 也 是 它 很 疲 行 的 原因 。USB 
与 FireWire 在 短 短 几米 的 距离 内 提供 相对 高 速 的 传输 速率 ,属于 串 行 通信 。 对 于 相对 较 长 的 距离 
(在 家 中 或 者 办 公 楼 )， 通 过 以 太 网 连接 〈 见 4.1 节 ) 的 串 行 通信 ， 无 论 是 通过 电线 还 是 无 线 电 广 
播 连接 ， 都 很 流行 。 

多 年 来 ， 传 统 的 语音 电话 线 在 远 距 离 通信 方面 一 直 主 宰 着 个 人 电脑 领域 。 这 些 通信 路 径 都 只 
有 一 根 电 线 ， 并 通过 它 逐 一 传输 语音 信号 ， 本 质 上 属于 串 行 系统 。 这样 的 数字 数据 传输 实现 过 程 
如 下 : 首先 利用 调制 解 调 器 (modulator-demodulator， 缩 写 为 modem) 将 位 模式 转换 为 听 得 见 的 
音调 ,并 通过 电话 系统 串 行 传输 , 然后 在 目的 地 由 另 一 个 调制 解 调 器 将 这 些 音调 转换 成 二 进 制 位 。 

为 了 通过 传统 的 电话 线 达到 更 加 快速 的 远 距 离 通信 ， 电 话 公 司 提供 了 一 种 称 为 DSL (digital 
subscriber ' ]ine， 数字 用 亡 线 路 ) 的 服务 ， 它 利用 以 下 事实 现存 的 电话 线 实际 上 是 能 够 处 理 比 
传统 话音 通信 息 宽 的 频 座 拖 围 的 。 确 切 地 说 ，DSL 使 用 局 于 可 听 范 围 的 频率 传输 数字 数据 ， 将 
较 低 频谱 用 于 语音 通信 。 其 他 可 与 之 相 竞争 的 技术 包括 用 于 有 线 电 视 系 统 的 电线 以 及 通过 无 线 
电 广播 的 卫星 线路 。 


2.5.5 ”通信 速率 
一 个 计算 部 件 与 另外 -- 个 计算 部 件 之 间 传输 数据 位 的 速率 是 以 biys (bit per second， 比 特 / 


” 秒 ) 计量 的 。 常 用 的 单位 有 Kbits (Kilo-bhiys， 等 于 10" biys)、Mbitys (mega-bps， 等 于 106 bitys ) 


和 Gbps 〈giga-bps， 等 于 10” bits )。 (注意 位 与 字 节 之 间 的 区 别 : 8 KbiVs 相 当 于 1 KB/s )。 

对 于 短 距 离 通 信 ，USB 及 FireWire 可 以 提供 几 百 M biys 的 传输 速率 ， 对 于 大 允 数 的 多 媒体 应 
用 已 经 足够 了 。 再 加 上 它们 的 便利 性 及 相对 低 价 ， 如 今 它 们 已 广泛 用 于 家 用 计算 机 与 本 地 外 围 
设备 的 通信 ， 如 打印 机 、 外 部 硬盘 驱动 器 以 及 相机 。 


2.6 其 他 体系 结构 69 





通过 结合 多 路 复 用 技术 《multiplexing， 数 据 编码 或 混合 ， 使 得 一 条 通信 路 径 完成 多 条 通信 路 径 
的 功能 ) 及 数据 压缩 技术 ， 传 统 的 语音 电话 系统 能 够 支持 57. 6 Kbivs 的 传输 速率 ， 这 无 法 满足 当今 
的 多 媒体 应 用 。 播 放 MP3 音 乐 需要 大 约 64K bits 的 传输 速率 ， 播 放 较 高 质量 的 视频 则 需要 用 Mbits 
计量 的 传输 速率 。 这 正 是 能 够 提供 M bits 范 围 的 传输 速率 的 DSL、 电 缆 以 及 卫星 通信 等 能 够 在 远 距 
高 数据 传输 中 迅速 取代 传统 音频 电话 系统 的 原因 。( 例 如 ，DSL 提 供 的 传输 率 大 约 为 54Mbiys。) 

一 个 特定 设置 可 获得 的 最 大 速率 ， 取 决 于 通信 路 径 的 种 类 以 及 实现 过 程 中 使 用 的 技术 。 这 
个 最 大 速率 通常 大 致 等 于 通信 路 径 的 带宽 (bandwidth )， 尽管 该 术语 除了 传输 速率 还 有 容量 的 
含义 。 也 就 是 说 ， 说 一 条 通信 路 径 具 有 高 带宽 意味 着 一 条 通信 路 径 能 以 高 速率 传输 位 ， 同 时 意 
味 看 该 通信 路 径 还 能 够 同时 携带 大 量 信息 。 


问题 与 练习 

1. 人 设 附录 C 描 “ 述 的 机 器 语言 使 用 存储 映射 输入 /输出 ， 地 址 B5 是 打印 机 端口 所 在 的 位 置 ， 要 打印 的 数 
据 应 该 发 送 给 它 。 

a 如 果 寄 存 器 7 包含 字母 A 的 ASCI 码 , 那么 要 通过 打印 机 打印 该 字母 ， 应 该 使 用 哪 条 机 器 语言 指令 ? 

b.， 如 果 该 计算 机 每 秒 执行 一 百 万 条 指令 ， 那 么 这 个 字符 在 - 秒 钟 内 可 以 向 打印 机 发 送 和 多 消 次 ? 

c. 如 朱伟 打印 机 一 分 钟 可 以 打印 5 页 传统 文本 ， 那 么 在 (b) 的 情况 下 ， 它 能 够 中 得 上 发 送 给 它 的 字 
符 吗 ? 

2. 假设 你 的 个 人 电脑 硬盘 每 分 钟 3000 转 ， 每 个 道 有 16 个 扇 区 ， 每 个 扇 区 有 1024 个 字 节 。 如 果 磁 查 控制 
髓 打算 从 磁盘 驱动 器 中 接收 从 旋转 磁盘 中 读 到 的 位 , 那 委 辜 盘 驱动 器 与 磁盘 控制 器 之 间 的 通信 速率 大 
约 是 多少 ? 

3. 一 本 以 ASCII 编 码 的 300 页 小 说 ， 接 照 57.6 Kbiys 的 速率 需要 传输 多 久 ? 


于 汪 本 一 直人， 生生 让 生生 生计 本 硬 PT 且 让 和 二 证 灿 让 RE EC 





了 六 二 二 下 天 二 


为 了 拓宽 我 们 的 视角 ， 我 们 来 考虑 一 些 已 经 讨论 过 的 传统 计算 机 体系 结构 的 替代 方案 。 


2.6.1 流水 线 


电子 脉冲 在 电线 上 的 传播 要 比 光 速 慢 。 光 大 约 每 纳 秒 (ns， 十 亿 分 之 一 秒 ) 能 传播 1 英尺 的 
距离 ,然而 CPU 中 的 控制 单元 至 少 需要 2 ns 才 能 从 1 英 太 之 外 的 存储 单元 中 读 取 到 指令 。( 必 须发 
送 读 请 求 到 存储 器 ， 这 至 少 需要 1 ns， 而 指令 又 必须 送 回 CPU， 这 也 需要 1 ns。) 因此 ， 在 这 样 
的 机 器 中 ， 取 指 和 执行 一 条 指令 需要 若干 纳 秒 一 这 就 意味 着 ， 提高 计算 机 的 执行 速度 问题 最 
终 将 变 成 小 型 化 问题 。 


多 核 CPU ， 0 
科技 使 得 越 来 越 多 的 电路 可 以 放置 在 一 个 硅 片 上 ， 以 致 计算 机 部 件 之 间 的 物理 差别 逐渐 
变 小 ， 例 如 ， 单 个 芯片 就 可 以 包括 CPU 和 主 存储 器 ， 这 是 片 上 系统 方法 的 二 个 例子 二 屿 的 是 
在 单个 设备 中 提供 一 个 完整 的 系统 ， 仗 得 在 更 高 的 设计 层面 被 用 作 一 个 抽 摹 工具. 在 其 他 情 
况 下 ， 单 个 设备 中 还 提供 相同 电路 的 多 个 复制 品 。 它 最 初 的 形 忒 是 包 伟 若干 独立 门 或 者 多 重 
乔 发 器 的 芯片 。 在 今天 的 技术 程度 下 ， 单 个 芯片 可 以 存放 不 止 一 个 完整 的 CPU 这 就 是 称 为 双 
核 CPU 设备 的 基础 体系 结构 : 在 同一 芯片 上 存在 两 个 CPU 以 及 共用 的 阅 速 缓冲 存 钳 器 :( 外 含 
两 小 处 理 单 元 的 多 核 CPU 通 常 被 称 作 双核 CPU. ) 这 种 设备 简化 了 MUMD 系 统 的 构建 ,， 芽 已 迅速 
应 用 于 家 用 计算 机 . 
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然而 ， 提 高 执行 速度 并 不 是 改进 计算 机 性 能 的 唯一 途径 ， 真 正 目 的 是 改进 机 器 的 吞吐 量 
(throughput) 一 一 机 器 在 给 定时 间 内 可 以 完成 的 工作 总 量 。 

在 不 要 求 提 高 执行 速度 的 前 提 下 , 增加 计算 机 吞吐 量 的 一 个 例子 是 流水 线 技术 (pipelining)， 
该 技术 允许 一 个 机 器 周期 内 各 步骤 重 登 进行 。 特 别 是 ， 当 执行 一 条 指令 时 ， 可 以 取 下 一 条 指令 ， 
也 就 意味 着 ， 在 任何 一 个 时 刻 可 以 有 不 止 一 条 指令 在 “流水 线 ” 上 ， 每 条 指令 处 在 不 同 的 处 理 
阶段 。 这 样 ， 尽 管 读 取 和 执行 每 条 指令 的 时 间 保 持 不 变 ， 计 算 机 的 总 吞吐 量 却 提高 了 . 《当然 ， 
当 到 达 一 条 JUMP《〈 转 移 ) 指令 时 ， 预 取 指 令 来 提高 效率 的 效果 已 是 不 现实 的 ， 因 为 “流水 线 ” 
上 的 指令 已 经 没有 用 了 .。) 

现代 计算 机 设计 已 使 得 流水 线 思想 大 大 超越 了 我 们 所 举 的 例子 。 它 们 经 常 能 够 同时 读 取 乔 
干 条 指令 ， 并 且 一 次 可 以 执行 多 条 彼此 互 不 依赖 的 指令 。 


2.6.2 ”多 处 理 器 计算 机 


流水 线 技术 可 以 看 作 迈 向 并 行 处 理 技术 (parallel processing ) 的 第 一 步 ， 并 行 处 理 技术 是 者 
干 活动 在 同一 时 间 里 实现 的 性 能 。 然 而 ， 真 正 的 并 行 处 理 技术 需要 求 多 个 处 理 单元 ， 于 是 产生 
了 多 处 理 器 计算 机 。 

当今 许多 计算 机 的 设计 都 是 基于 这 种 思想 ， 其 中 一 个 策略 是 将 若干 处 理 单元 都 连接 到 同一 
个 主 存储 器 上 ， 其 中 每 一 个 都 像 单 处 理 器 机 器 中 的 CPU。 在 这 样 的 配置 下 ， 各 处 理 器 可 以 独立 
地 工作 ， 并 通过 把 相关 的 信息 放 在 公共 存储 单元 里 来 协调 各 自 的 工作 。 例 如 ， 当 茶 个 处 理 嚣 遇 
到 一 个 大 任务 时 ， 它 可 以 将 部 分 任务 的 程序 存储 在 这 个 公共 存储 器 中 ， 然 后 请 求 其 他 的 处 理 器 
去 执行 它 。 结 果 产 生 这 样 的 计算 机 :， 不同 的 指令 序列 在 不 同 的 数据 集 上 操作 ， 相 对 于 较 传 统 的 
SISD (single-instruction stream，single-data stream， 单 指令 流 单数 据 流 ) 体系 结构 它 称 为 MIMD 
(multiple-instruction stream，multiple-data stream， 多 指令 流 多 数据 流 ) 体系 结构 。 

多 处 理 器 体系 结构 的 一 个 变 体 是 将 多 个 处 理 器 连接 起 来 ， 使 得 它们 一 起 执行 同一 个 指令 邦 
列 ， 每 个 处 理 器 都 有 各 自 的 数据 集 。 这 就 产生 了 SIMD 《single-instruction stream，multiple-data 
stream， 单 指令 流 多 数据 流 ) 体系 结构 。 这 种 计算 机 适用 于 这 样 的 应 用 ， 在 一 大 堆 数据 中 ， 对 
于 其 中 每 组 类 似 的 数据 项 都 要 执行 同样 的 任务 。 

并 行 处 理 的 另外 一 种 方法 是 将 许多 小 型 计算 机 聚 集成 为 大 的 计算 机 ， 每 台 计 算 机 都 有 目 己 
的 存储 器 和 CPU。 这 样 ， 每 台 小 型 计算 机 都 与 它 相 邻 的 一 台 或 几 台 计算 机 相 和 连接， 使 得 赂 了 整 
个 系统 的 任务 可 以 分 割 到 各 台 小 计算 机 上 实现 。 因 此 ， 如 果 一 项 任务 分 配给 内 部 计算 机 ， 那 么 
它 可 以 把 该 任务 分 割 为 若干 独立 的 子 任 务 ， 再 请 求 它 的 邻居 们 并 发 地 完成 各 个 子 任 务 。 这 样 ， 
完成 任务 的 时 间 可 以 比 由 一 台 单 处 理 器 计算 机 独立 完成 任务 所 需要 的 时 间 少 得 多 。 

在 第 11 章 中 我 们 还 将 研究 另外 一 种 多 处 理 器 体系 结构 一 盖 人工 神经 网 络 ， 它 的 设计 是 基于 
生物 神经 系统 的 理论 。 这 些 机 器 都 是 由 许多 基本 处 理 器 或 处 理 单元 组 成 的 ， 它 们 中 每 一 个 输出 
都 是 对 它 输入 组 合 的 简单 反应 。 这 些 简 单 处 理 器 连接 成 网 络 ， 其 中 一 些 处 理 器 的 输出 被 用 作 即 
外 一 些 的 输入 。 这 样 一 台 计 算 机 是 要 通过 调节 每 个 处 理 器 的 输出 来 编程 的 ， 以 控制 连接 于 它 的 
那些 处 理 器 的 反应 程度 。 它 基于 如 下 原理 : 生物 神经 网 络 通过 调节 神经 细胞 之 间 结 合 处 〈 突 触 ) 
的 化 学 构成 来 产生 对 给 定 刺激 的 特定 反应 ， 这 种 化 学 构成 转 而 又 影响 了 一 个 神经 细胞 对 其 他 神 
经 的 反应 能 力 。 

人 工 神经 网 络 的 支持 者 认为 ， 尽 管 在 技术 上 已 经 能 够 构造 像 人 脑 神 经 那么 多 开关 电路 〈 神 
经 单元 被 看 认为 是 个 开关 电路 ) 的 电子 电路 的 能 力 ， 但 是 现在 计算 机 的 能 力 还 是 远 没 有 达到 人 
类 思维 的 能 力 。 他 们 认为 ， 这 是 汉 . 诺 依 曼 体系 结构 规定 的 传统 计算 机 部 件 低 效率 用 法 的 结果 。 
毕竟 ， 如 果 一 台 计 算 机 用 大 量 的 存储 电路 支持 少量 的 处 理 器 ， 那 么 大 多 数 电路 在 大 部 分 时 间 将 
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是 空闲 的 ， 而 在 任何 时 刻 ， 人 脑 中 的 大 多 数 神经 都 是 活跃 的 。 
计算 机 设计 的 研究 正在 拓展 基本 的 CPU- 主 存储 器 模型 ， 并 且 在 某 些 情况 下 完全 摆脱 这 一 模 


型 ， 以 开发 更 有 用 的 计算 机 。 


问题 与 练习 

- 回 到 2.3 节 问题 3， 如 果 该 计算 机 使 用 了 本 书 讨论 的 流水 线 技术 ， 当地 址 为 AA 的 指令 被 执行 时 ，“ 流 

水 线 ” 里 有 什么 ? 在 什么 条 件 下 ， 该 程序 并 没有 从 流水 线 技术 得 到 好 处 ? 

2 在 一 台 流 水 线 计算 机 上 运行 2.3 节 问题 4 中 的 程序 时 ， 上 必须 要 解决 什么 冲突 ? 

: 疏 设 有 两 个 “中 央 ” 处 理 器 连接 到 同一 个 存储 器 上 ， 但 执行 不 同 的 程序 ， 再 假设 ， 其 中 一 个 处 理 器 
需要 给 一 个 存储 单元 加 1， 几 乎 同时 ， 羽 外 一 个 处 理 器 需要 给 同一 个 存储 单元 减 1。( 兆 效果 似乎 是 该 
仓储 单元 最 终 保持 开始 时 的 值 。) 

a 描述 一 个 执行 序列 ， 其 结果 为 该 单元 最 终 数值 比 开 始 值 少 1。 
b. 摘 述 一 个 执行 序列 ， 其 结果 为 该 单元 最 终 数值 比 开 始 值 大 1。 


王 -一 


人 








复习 题 
《 带 * 的 题目 涉及 选读 小 节 的 内 容 。) 为 00 的 存储 单元 的 内 容 。 
1. a， 在 什么 情况 下 ， 通 用 寄存 器 和 主 存储 单元 6. 假设 3 个 数值 *、y、z 存 储 在 机 器 的 存储 器 中 。 
类 似 ? 描述 在 计算 x +y + z 时 发 生 的 事件 序列 《如 从 
b， 在 什么 情况 下 ， 通 用 寄存 器 和 主 存储 单元 和 存储 器 装 入 寄存 器 , 将 数值 保存 在 存储 器 ,等 
不 同 ? 等 ) 。 计 算 (2x) +y 时 又 如 何 呢 ? 

2. 根据 附录 C 描 述 的 机 器 语言 回答 下 列 问题 . 7 下 面 是 用 附录 C 描 述 的 机 器 语言 编写 的 指令 。 

a. 将 指令 2105〔〈 十 六 进 制 ) 写成 16 位 位 串 。 把 它 翻 译 成 为 自然 语言 。 

b. 将 指令 A324 (十 六 进 制 ) 的 操作 码 写成 4 a.407E b.8008 ce. Ad403 
位 位 串 。 d. 2835 ”ee.B3AD 

c. 将 指令 A324 (十 六 进 制 ) 操作 数字 段 写成 8. 假设 有 一 机 器 语言 , 指令 的 操作 码 字段 为 4 位 。 
12 位 位 串 。 那么 该 语言 可 以 有 多少 条 不 同 的 指令 ? 如果 

3. 假设 在 附录 C 描 述 的 机 器 里 一 个 数据 块 存储 在 操作 码 字 段 增加 到 8 位 呢 ? 

地 址 从 B9 到 C1〔 含 ) 的 存储 单元 中 。 这 一 数据 9. 将 下 列 指令 由 自然 语言 翻译 为 附录 C 描 述 的 
块 占据 多 少 主 存储 单元 ? 列 出 它们 的 地 址 。 机 器 语言 。 

4. 在 附录 C 描 述 的 机 器 里 ， 刚 执行 完 指 令 为 a. 将 十 六 进 制 值 66 装 入 〔LOAD) 寄存 器 7， 
BOBA 的 指令 后 程序 计数 器 的 值 是 才 少 ? b. 将 仓储 单元 66 的 内 容 装 入 寄存 器 7。 

5. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 c. 将 寄存 器 F 和 2 的 内 容 进 行 AND 运 算 ， 结 果 
存储 单元 中 包含 下 列 位 模式 ; 存 于 寄存 器 0。 
RE d 将 寄存 器 4 循环 右 移 (ROTATE) 3 位 。， 
人 e. 如 果 寄 存 器 0 的 内 容 与 寄存 器 B 的 数值 相同 ， 

0] 04 则 苇 移 (JUMP) 到 存储 器 地 址 为 31 的 指令 。 

02 31 10. 重 写 图 2-7 中 的 程序 ， 假 定 相 加 的 数值 用 浮 点 

03 00 记 数 法 编码 ， 而 不 是 二 进 制 补 码 记 数 法 ， 

0 C0 1 下面 是 用 附录 C 描 述 的 机 器 语言 编写 的 指令 。 
人 请 按照 它们 的 执行 是 否 改变 存储 地 址 为 3B 的 
假定 该 程序 计数 器 初始 值 为 00, 请 记录 该 程序 仓储 单元 的 值 、 是 否 读 取 地 址 为 3B 的 存储 单 
执行 到 停止 这 一 过 程 中 在 每 个 机 器 周期 取 指 元 的 内 容 、 是 否 与 地 址 为 3B 的 存储 单元 的 内 


阶段 末尾 ,程序 计数 器 、 指 令 寄存 器 以 及 地 址 容 没 有 关系 进行 分 类 。 
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同 二 ” 一 


14. 


a. 153B ”hb.253B ec. 353B 
d 3B3B 。 e, 403B 


假设 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 03 的 存 








储 单 元 中 包含 下 列 位 榨 陈 ， 
地 址 内 容 
00 24 
01 05 
02 C0 
03 00 





下 将 第 一 条 指令 翻译 为 自然 语言 。 
b. 如 果 机 器 在 程序 计数 器 的 值 为 00 时 月 动 ， 








那么 机 器 停止 时 寄存 器 4 是 什么 位 模式 ? 
, 假设 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 02 的 存 
储 单元 中 包 售 下 列 位 模式 : 
地 址 内 容 
00 24 
01 1B 
02 34 





a. 如 果 机 器 在 程序 计数 器 值 为 00 时 月 动 ， 执 
行 的 第 一 条 指令 会 是 什么 ? 

b. 如 果 机 器 在 程序 计数 器 值 为 01 时 局 动 ， 执 
行 的 第 一 条 指令 会 是 什么 ? 

假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 








存储 单元 中 包含 下 面 位 模式 : 
地 址 内 容 

00 10 

01 04 

02 30 

03 45 

04 C0 

05 00 
假设 机 器 在 程序 计数 器 的 值 为 00 时 启动 ， 回 
答 下 面 问题 。 


a. 将 要 执行 的 指令 翻译 成 自然 语言 。 

b. 当 机 器 停止 时 ， 地 址 为 45 的 存储 单元 中 是 
什么 位 模式 ? 

c. 当 机 器 停止 时 ， 程 序 计 数 器 中 是 什么 位 
模式 ? 


. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 09 的 





存储 单元 中 包含 下 列 位 模式 : 
地 址 内 容 
1A 
01 02 
2B 


17. 








( 续 ) 

地 址 内 容 

03 02 

04 9C 

05 AB 

06 3C 

07 00 

08 C0 

09 00 


假设 机 器 在 程序 计数 器 的 值 为 00 时 启动 , 回答 

下 列 问题 。 

a， 当 机 器 停止 时 ， 地 址 为 00 的 存 情 单 元 里 有 
什么 ? 

b. 当 机 器 停止 时 ， 程 序 计 数 器 中 会 是 什么 位 
模式 ? 


. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 07 


的 存储 单元 中 包 售 下 列 位 模式 ， 








地 址 内 容 
00 1A 
01 06 
02 3A 
03 07 
04 C0 
05 00 
06 23 
07 00 


a 假设 机 器 在 程序 计数 器 的 值 为 00 时 用 动 ，- 

请 列 出 包含 待 执行 程序 的 存储 单元 的 地 址 。 
b. 列 出 用 于 存储 数据 的 存储 单元 的 地 址 。 
假设 在 附录 C 描 述 的 机 器 里 , 从 地 址 00 到 0D 的 
存储 单元 中 包含 下 列 位 模 陈 : 


地 址 


内 容 
20 
03 
21 
0l 
40 
12 

06 51 
12 

B1l 
0C 
B0 
06 
cn0 
00 





假 证 机 器 在 程序 计数 器 的 值 为 00 时 有 局 动 。 

a， 当 机 器 停止 时 ， 寄 存 器 1 中 是 什么 位 模式 ? 

b. 当 机 器 停止 时 ,寄存器 0 中 是 什么 位 模式 ? 

c. 当 机 器 停止 时 ， 程 序 计 数 器 中 是 什么 位 
司 陈 ? 


18. 假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 F0 到 FD 


的 和 存储 单元 中 包 合 下 列 〈 十 六 进 制 ) 位 模式 ; 


地 址 内 容 
FO 20 
Fl 00 
F2 21 
FE3 01 
F4 23 
F5 05 
F6 B3 
F7 FC 
F8 50 
F9 01 
FA B0 
FB F6 
FC C0 
FD 00 


如 采 机 器 在 程序 计数 器 的 值 为 F0 时 启动 ， 那 
么 当 计 算 机 最 终 执行 到 地 址 为 FC 的 停机 指令 
时 ， 寄 存 器 0 中 的 值 是 什么 ? 


19. 如 果 在 附录 C 描 述 的 机 器 每 微 秒 〈 百 万 分 之 一 


秘 ) 执行 一 条 指令 ， 那 么 完成 问题 18 中 的 程序 
项 用 时 多 少 ? 


20. 假 议 在 附录 C 摘 述 的 机 器 里 ， 从 地 址 20 到 28 的 


存储 单元 中 包含 下 列 位 模式 : 
地 址 内 容 

20 12 
21 20 
22 32 
23 30 
24 B0 
25 亲 
26 20 
27 C0 
28 00 

假设 机 器 在 程序 计数 器 的 值 为 20 时 启动 。 


a. 当 机 器 停止 时 ， 寄 存 器 0、1 和 2 中 是 什么 位 
模式 ? 

b.， 当 机 器 停止 时 ， 地 址 为 30 的 存储 单元 中 是 
什么 位 模式 ? 


2 


2. 


23. 


之 


1 . 


1 


二 
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c. 当 机 器 停止 时 ， 地 址 为 B0 的 存储 单元 中 是 


什么 位 模式 ? 
假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 AF 到 B1 
的 存储 单元 中 包含 下 列 位 模式 : 
地 址 内 容 
矶 下 了 总 
BO 也 0 
防 1 点 下 


如 乐 机 器 在 程序 计数 器 的 值 为 AF 时 启动 ， 那 


人 么 会 发 什么 
假设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 
存储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 ; 


地 址 内 容 

0O0 5 

0U1 BD 

(和 2 35 

03 0O4 

04 CO 

05 UU 
如 果 机 器 在 程序 计数 器 的 值 为 00 时 启动 , 那么 
机 器 在 什么 时 候 会 停止 ? 


对 于 下 面 每 种 情况 ， 用 附录 C 描 述 的 机 器 语言 

编写 一 个 小 程序 来 完成 以 下 任务 .假定 每 个 程 

序 都 放 在 从 地 址 00 开 始 的 存储 器 里 。 

a. 将 存储 单元 8D 的 值 移动 到 存储 单元 B3。 

b. 交换 存储 单元 8D 和 B3 中 的 值 。 

c. 如 果 存 储 单元 45 的 数值 是 00， 则 将 值 CC 存 
放 在 存储 单元 88， 否 则 ， 将 值 DD 存 放 在 存 
储 单元 88。 


. 在 计算 机 爱好 者 中 曾经 流行 一 种 游戏 叫 磁 芯 


大 战 《Core Wars ) 一 一 战舰 游戏 的 变 体 。( 术 
语 磁 区 来源 于 早期 的 存储 技术 , 它 用 磁 材 料 的 
小 环 的 磁场 方向 表示 0 和 1。 小 环 称 为 磁 蕊 。) 
这 个 游戏 是 在 两 个 对 立 的 程序 之 间 玩 , 每 个 程 
序 分 别 存储 在 同一 台 计 算 机 的 存储 器 的 不 同 
位 置 里 。 假 设 该 计算 机 在 轮流 执行 这 两 个 程 
序 ， 先 执行 一 个 程序 的 一 条 指令 ， 再 执行 另 一 
个 程序 的 一 条 指令 .每 个 程序 的 目标 是 通过 把 
额外 数据 写 到 在 另外 一 个 程序 上 来 破坏 对 方 
程序 ， 不 过 ， 哪 个 程序 都 不 知道 对 方 的 位 置 。 
a. 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 , 它 

采用 防卫 的 方式 ， 以 最 小 的 代价 玩 此 游戏 。 
b. 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 , 它 

通过 不 断 将 自己 称 到 不 同 地 方 避免 受到 对 
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25， 


了 


o 


2 


已 辣 


志 . 


方程 序 的 克 击 。 更 确切 地 说 ， 编 写 程 序 在 
位 置 00 开 始 ， 然 后 把 自己 复制 到 位 置 70， 
再 转移 到 这 个 新 位 置 。 

,. 直 展 (b) 中 的 程序 ， 继 续 将 新 位 置 的 程序 重 
新 定位 。 具 体 来 说 ， 先 将 程序 移 奋 位置 70， 
然后 移 到 E0 〈=70+70) ， 再 称 到 60 
(=70+70+70) ， 等 等 。 

用 附 录 C 描 述 的 机 器 语言 编写 一 个 程序 ， 它 计 

算 人 存放 在 存储 单元 A1、A2、A3 及 Ad4 中 二 进 制 

补 码 值 的 和 ， 并 将 结果 存 入 存储 单元 AS 中 。 


| 


- 代 设 在 附录 C 描 述 的 机 器 里 ， 从 地 址 00 到 05 的 


生 储 单元 中 包含 下 列 〈 十 六 进 制 ) 位 模式 ; 





地 址 内 容 
00 20 
01 Cn 
02 30 
03 04 
04 00 
05 00 
= 


如 果 机 器 在 程序 计数 器 的 值 为 00 时 启动 ,会 发 
生 什 么 ? 


: 假设 在 附录 C 描 述 的 机 器 里 ， 地 址 为 06 和 07 的 


仓储 单元 中 分 别 包含 位 模式 BO0 和 06， 并 且 机 
钴 月 动 时 程序 计数 器 中 包含 数值 06, 那么 会 发 
生 什 系 ? 


. 假设 下 列 用 附录 C 中 描述 的 机 器 语言 编写 的 


柱 序 仓 储 在 从 地 址 30 (十 六 进 制 ) 开始 的 主 存 
储 器 中 . 当 执行 该 程序 时 它 会 完成 哪些 任务 ? 


2003 
2101 
2200 
2310 
1400 
3410 
5231 
5331 
3239 
333B 
了 48 
也 口 3 总 
c000 


概述 当 附录 C 描 述 的 机 器 执行 一 条 操作 码 为 B 
的 指令 时 所 涉及 的 步骤 。 用 一 组 说 明 来 表示 你 


30. 


Tu 


42. 


3 


人 


34. 


“3 


的 答案 ， 好 像 你 在 告诉 CPU 做 什么 。 
概述 当 附 录 C 描 述 的 机 器 执行 -- 条 操作 码 为 
的 指令 时 所 涉及 的 步骤 .用 一 组 说 明 来 表示 你 
的 答案 ， 好 像 你 在 告诉 CPU 做 什么 。 


- 概述 当 附 录 C 描 述 的 机 器 执行 一 条 操作 码 为 6 


的 指令 时 所 涉及 的 步骤 。 用 一 组 说 明 来 表示 你 
的 答案 ， 好 像 你 在 告诉 CPU 做 什么 。 

假设 在 附录 C 描 述 的 机 器 里 ， 寄 存 器 4 和 5 中 分 
别 包括 位 模式 3C 和 C8， 在 执行 下 列 每 条 指令 
后 ， 寄 存 器 0 中 会 留 下 什么 位 模式? 

a. 5045 b. 6045 c. 7045 

d. 8045 e. 9045 


. 利用 附录 C 描 述 的 机 器 语言 ， 为 完成 下 面 每 个 


任务 编写 一 个 程序 。 

a. 将 存储 单元 66 中 存储 的 位 模式 复制 到 存储 
单元 BB 中 。 

b. 将 仓储 单元 34 中 的 最 低 4 个 有 效 位 变 成 0， 
并 保持 其 他 位 不 变 。 

c. 将 仔 储 单元 A5 中 的 最 低 4 个 有 效 位 复制 到 
单 岂 A6 中 的 最 低 4 个 有 效 位 , 并 保持 A6 中 的 
其 他 位 不 变 。 

d. 将 存储 单元 A5 中 的 最 低 4 个 有 效 位 复制 到 


单元 A5 中 的 最 高 4 个 有 效 位 。 (于 是 ，A5 
中 的 前 4 位 将 和 后 4 位 相同 。) 
完成 下 列 运算 。 
a， 111000 bb， 000100 
ANER_101001 AND_ 101010 
C， 000100 111011 
ANDP _ 010101 AND_ 110101 
e， 111000 工 000100 
SR 101001 coR 101010 
名 000100 hh. 111011 
R 101 OR 110101 
j. 111000 jj 000100 
宇 OR 1 ul1001 宇 UR_ _] 01010 
K. 000100 1 111011 
其 吕 民 昌 1 是 1 2OR_ 110101 
为 了 完成 下 面 的 任务 , 确定 所 需要 的 掩 码 和 这 
辑 运 算 。 


a 将 一 个 8 位 的 位 模式 的 中 间 4 位 置 0， 并 且 不 
影响 其 他 位 。 

b. 将 一 个 8 位 的 位 模式 取 反 。 

5 将 一 个 8 位 的 位 模式 最 高 有 效 位 取 反 ， 并 且 
不 影响 其 他 位 。 





灿 将 一 个 8 位 的 位 模式 的 最 高 有 效 位 置 1， 并 
且 不 影响 其 他 位 。 

e,， 将 一 个 8 位 的 位 模式 的 除 最 高 有 效 位 外 所 
有 的 位 都 置 1， 并 且 不 改变 最 高 有 效 位 。 


*36. 确定 一 个 逻辑 运算 〈 以 及 相应 的 掩 码 ) ， 使 得 


3 


3 


忆 忆 


39， 


*40， 


主 直 


aa 


本 由 2， 


中 3. 


*d44. 
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当 其 用 于 一 个 8 位 的 输入 串 时 ， 当 且 仅 当 输入 
串 为 10000001 时 ， 产 生 的 输出 位 串 都 为 0。 
描述 一 组 逻辑 运算 〈 以 及 它们 相应 的 掩 码 ) ， 
使 得 当 其 用 于 一 个 8 位 的 输入 串 时 ， 当 且 仅 当 
这 个 输入 串 的 最 高 位 和 最 低位 是 1 时 输出 结果 
邵 为 0， 否 则 输出 中 至 少 应 包含 一 个 1 


.对 下 列 位 模式 执行 循环 左 移 4 位 后 ， 结 果 如 


何 ? 

a. I0101 b. 11110000 

dd 10O1000 &. 00001 

下 列子 节 用 十 六 进 制 记 数 法 表示 , 对 其 执行 循 

环 石 移 1 位 后 ， 结 果 如 何 ? 【用 十 六 进 制 记 数 

法 写 出 答案 。) 

a. 3 b. 0D C. FF dd 77 

a. 在 附录 C 描 述 的 机 器 语言 中 ， 用 什么 样 的 单 
个 指令 可 以 完成 寄存 器 B 循 环 右 移 3 位 ? 

b. 在 附录 C 描 述 的 机 器 语言 中 , 用 什么 样 的 单 
人 小指 令 可 以 完成 寄存 器 B 循 环 左 移 3 位 ? 


c, 0UO01] 


- 用 附录 C 描 述 的 机 器 语言 编写 程序 : 把 地 址 为 


8C 的 存储 单元 的 内 容 颠 倒 过 来 。 (也 就 是 说 ， 
对 于 地 址 8C 最 后 的 位 模式 ， 从 左 向 右 读 取 与 
最 初 从 右 向 左 读 取 一 致 。) 

用 附录 C 描 述 的 机 器 语言 编写 程序 : 将 地 址 A0 
中 存储 的 数值 减 去 Al 中 存储 的 数值 ， 并 将 结 
果 存 于 地 址 A2 中 。 假 定数 值 用 二 进 制 补 码 记 
数 法 编码 。 

如 果 一 台 打 印 机 每 种 打印 40 个 字符 , 那么 它 能 
跟 得 上 以 300 bitys 的 速率 向 它 串 行 发 送 的 
ASCI 字 符 串 吗 〔〈 每 个 符号 占 一 个 字 节 ) ? 如 
果 是 1200 hits 呢 ? 

假设 某 人 在 键盘 上 每 分 钟 能 打 30 个 单词 。( 假 
设 一 个 单词 以 5 个 字符 计 。) 如 果 计 算 机 每 微 
秒 (上 百 万 分 之 一 秒 ) 执行 50 条 指令 ， 那么 该 计 


社会 问题 





下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问 题 。 回 答 这 些 问题 不 


必 


“二 3. 


440， 


村 中 


和 | 


OO 
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用 
巧遇 
je 


To 


社会 问题 75 


算 机 在 打 两 个 连续 的 字符 之 间 可 以 执行 多 少 
条 指令 ? 

对 于 一 个 每 分 钟 打 30 个 单词 的 打字 员 , 键盘 每 
种 传输 多 少 位 才能 跟 得 上 ? 《假定 每 个 字符 以 
ASCI 编 码 并 带 有 奇偶 位 ， 每 个 单词 以 5 个 字 
符 计 。 ) 

假设 附录 C 中 描述 的 机 器 与 使 用 存储 映射 输 
入 /输出 技术 的 打印 机 通信 ， 同 时 假设 地 址 FF 
用 于 将 字符 发 送 给 打印 机 ， 地 址 FE 用 于 接收 
该 打印 机 的 状态 信息 。 特 别 地 ， 假 设 地 址 FE 
的 最 低 有 效 位 用 于 指示 该 打印 机 是 否 准备 好 
接收 下 一 个 字符 〈0 表 示 “ 未 准备 好 ”，1 表 示 
“ 玲 备 好 ”) 。 从 地 址 00 开 始 ， 编 写 一 个 机 器 
语言 例 程 , 它 等 待 打印 机 准备 好 接收 下 一 个 字 
符 ， 然 后 把 由 寄存 器 5 中 位 模式 表示 的 字符 发 
送 给 打印 机 。 


- 用 附录 C 描 述 的 机 器 语言 编写 一 个 程序 : 它 在 


地 址 从 A0 到 C0 的 所 有 存储 单元 中 存放 0, 但 是 
它 应 该 足够 小 以 致 能 够 存放 在 地 址 从 00 到 13 
(十 六 进 制 ) 的 存储 单元 中 。 


- 局 设 某 计算 机 硬盘 上 有 20GB 存 储 空间 可 用 ， 


以 14400 bitys 的 速率 从 电话 线路 接收 数据 。 以 
这 个 速率 ， 需 要 多 入 可 以 存 满 可 用 的 存储 空 
| 可? 

假设 某 通信 线路 正 以 14400bits 的 速率 串 行 传 
输 数 据 。 如 果 一 个 突 发 的 干扰 持续 了 0.01 s， 
那么 有 多 少数 据 位 会 受到 影响 ? 

假 皮 给 你 32 个 处 理 器 , 每 个 处 理 器 在 一 秒 钟 内 
能 够 完成 两 个 多 位 数字 加 法 运算 100 万 次 。 描 
述 如 何 使 用 并 行 处 理 技术 ， 使 得 能 够 在 
6x10”s 的 时 间 内 完成 64 个 数 的 求 和 。 单独 一 
个 处 理 器 完成 相同 的 计算 需要 多 少时 间 ? 


, 概述 CISC 体 系 结构 和 RISC 体 系 结构 之 间 的 区 


市 。 


: 说 出 两 种 提高 吞吐 量 的 方法 。 
- 对 于 计 咎 一 组 数值 的 平均 值 , 说 明 在 一 台 多 处 


香 征 的 计算 机 上 为 何 比 在 一 台 单 处 理 器 的 计 
算 机 上 快 得 多 ? 


二 各 水 秆 和 用 各 让 国生 的 和 和 轩 和 各 全 让 机 和 计生 让 HE Er 


一 


是 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 
1. 假设 某 计 算 机 生产 商 开 发 了 一 种 新 型 的 计算 机 体系 结构 。 该 公司 在 多 大 程度 上 可 以 拥有 
该 体系 结构 所 有 权 ? 什么 样 的 政策 对 社会 最 好 ? 


5 
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. 从 某 种 意义 上 说 ，1923 年 是 现今 被 许多 人 称 为 有 计划 淘汰 现象 诞生 的 时 间 。 这 一 年 ， 由 
斯 隆 领导 的 通用 汽车 公司 将 汽车 工业 引 向 了 型 号 概念 的 年 代 。 其 思想 是 通过 改变 风格 ， 
而 不 单纯 是 介绍 更 好 的 车 来 提高 销售 。 引 用 斯 隆 的 一 句 话 : “我 们 希望 你 们 对 自己 现在 
的 车 不 满意 ， 于 是 你 们 将 会 购买 新 车 。.” 如 今 ， 计 算 机 工业 在 多 大 程度 上 使 用 了 这 种 市 
场 策 略 ? 

3. 我 们 常常 在 想 ， 计 算 机 技术 如 何 改变 了 我 们 的 社会 。 不 过 ， 许 多 人 争辩 说 ， 这 门 技术 自 
出 现 以 来 常常 为 了 避免 发 生 改 变 而 使 老 系统 继续 存在 ， 甚 至 根深 蒂 固 。 例 如 ， 如 果 没 有 
计 复 机 技术 ， 中 央 政 府 在 社会 中 的 角色 会 继续 存在 吗 ? 如 果 没 有 计算 机 技术 ， 集 权 化 在 
今天 能 够 达到 什么 程度 ? 如 果 没 有 计算 机 技术 ， 我 们 在 多 大 程度 上 会 更 好 或 更 坏 ? 

4. 如 染 某 人 认为 自己 不 需要 知道 机 器 的 任何 内 部 细节 〈 因 为 有 其 他 人 会 建造 它 ， 维 护 它 ， 
并 解决 可 能 发 生 的 问题 )， 这 种 想法 合理 吗 ? 你 的 答案 会 取决 于 这 个 机 器 是 计算 机 、 汽 
车 、 核 电厂 还 是 烤 面包 机 吗 ? 

假设 一 家 三 商 生 产 了 一 种 计算 机 芯片 ， 但 是 后 来 发 现 它 设 计 上 有 一 个 瑕 疲 。 再 假设 该 生 
产 商 在 接 下 来 的 生产 中 修正 了 瑕 疣 ， 但 决定 掩盖 最 初 的 瑕 狗 ， 并 且 不 回收 已 经 售 出 的 共 
片 ， 理 由 是 :已 经 售 出 的 芯片 没有 一 个 在 该 瑕 疲 会 产生 严重 后 果 的 应 用 中 使 用 。 有 人 会 
因为 该 生产 商 的 决定 而 受到 伤害 吗 ? 如 果 没 有 人 受到 伤害 ， 而 且 该 决定 避免 了 资金 的 流 
失 亦 或 者 避免 了 辞退 员工 ， 那 么 该 生产 商 的 决定 正确 吗 ? 

6. 是 技术 进步 治愈 了 心脏 病 ， 还 是 它 导致 久 坐 的 生活 习惯 进而 导致 了 心脏 病 ? 

7. 很 容易 想象 ， 由 溢出 和 截断 错误 而 产生 的 算术 差错 可 能 会 导致 金融 或 导航 方面 的 灾难 。 

对 于 图 像 存储 系统 ， 由 于 丢失 图 像 细 节 〈 也 许 在 勘察 或 医疗 诊断 领域 ) 而 产生 的 错误 信 

有 什么 后 果 ? 
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第 过 漳 
操作 系统 


ARyr 一 章 ， 我 们 将 讨论 操作 系统 。 操 作 系统 是 用 来 协调 计算 机 的 内 部 活动 以 及 检查 计算 机 
“与 外 部 世界 通信 的 软件 包 。 通 过 操作 系统 ， 能 将 计算 机 硬件 转化 为 有 用 的 工具 ， 我 们 

的 目标 就 是 要 理解 操作 系统 做 哪些 工作 以 及 它 是 如 何 完成 这 些 工作 的 。 要 成 为 有 知识 的 计算 机 
使 用 者 ， 这 样 的 背景 是 核心 的 。 

操作 系统 〈operation system) 是 控制 计算 机 所 有 操作 的 软件 。 它 提供 了 用 户 可 以 存储 和 检 
索 文件 的 方法 ， 提 供 了 用 户 可 以 请 求 执行 程序 的 接口 ， 还 提供 了 程序 请 求 执行 所 必需 的 环境 。 

操作 系统 最 著名 的 例子 是 Windows， 微 软 公 司 已 经 发 布 了 很 多 版 本 , 并 广泛 用 于 PC 机 领域 . 
尺 一 个 锌 三 泛 认 可 的 例子 是 UNIX， 它 是 服务 于 较 大 的 计算 机 系统 和 PC 群 的 流行 选择 。 事 实 上 ， 
UNE 征 Mac OS 的 核心 ，Mac OS 是 苹果 公司 发 布 的 归 类 于 Mac 机 的 一 种 操作 系统 。 另 外 ， 还 有 
能 够 运用 于 大 型 机 和 小 型 机 的 Linux 操 作 系 统 , 该 系统 最 初 是 由 一 些 计 算 机 爱好 者 以 非 盈 利 的 目 
的 开发 的 ， 到 目前 为 止 ， 包 括 IBM 公 司 在 内 的 许多 商业 机 构 都 发 布 了 Linux 操 作 系 统 。 


3.1_ 操 作 系统 的 历史 


一 一 Re 和 间 


人 疝 导 于 训 让 司 衣 后 亲 请 这 向 扑 7 生 向 全 生生 和 肝 村 和 直 且 让 司 生计 丰 二 于 语 


今天 的 操作 系统 经 过 长 期 的 演变 已 经 成 为 一 个 大 而 复杂 的 软件 包 。20 世 纪 四 、 五 十 年 代 ， 
计算 机 不 是 很 灵活 ， 效 率 也 不 高 。 一 台 计 算 机 占据 整个 房间 。 执行 程序 需要 大 量 的 设备 准备 工 
作 , 如 安装 磁带 、 把 穿孔 卡片 放 在 读 卡 机 上 、 设 置 开 关 等 等 。 每 个 程序 的 执行 称 为 一 个 作业 (job )， 
它 是 作为 一 个 独立 的 活动 处 理 的 一 一 为 执行 该 程序 准备 好 计算 机 、 执 行程 序 ， 然 后 在 下 - 小 程 
序 的 准备 工作 开始 之 前 ， 必 须 重 新 获取 磁带 、 穿 孔 卡 片 等 所 有 一 切 。 当 几 个 用 户 需 要 共享 一 台 
机 器 时 ， 操 作 系统 提供 签名 表 ， 以 便 各 个 用 户 能 够 预订 到 一 段 机 器 时 间 。 在 分 配给 某 个 用 户 的 
时 间 段 内 ， 机 器 就 完全 处 于 该 用 户 的 控制 之 下 。 这 段 时 间 通 常 是 从 程序 的 准备 开始 ， 接 下 来 是 
短 时间 的 程序 执行 过 程 。 一 个 用 户 本 可 以 在 很 短 的 时 间 内 尽 可 能 多 做 一 些 事情 ， 但 下 一 个 用 户 
已 经 迫不及待 地 要 使 用 机 器 做 准备 工作 了 。 

在 这 样 的 环境 下 ， 操 作 系统 开始 作为 一 个 系统 致力 于 简化 程序 的 准备 工作 ， 提高 作业 之 间 
的 过 小 效率 。 操 作 系统 早期 的 开发 是 用 户 与 设备 的 分 离 ， 用 以 避免 用 户 进出 计算 机 机 房 。 为 此 
雇 侦 了 计算 机 操作 员 来 操作 机 器 。 任 何人 如 果 需 要 运行 程序 ， 就 必须 把 程序 、 所 需 的 数据 以 及 
有 天 程序 需求 的 特别 说 明 提 交 给 操作 员 ， 由 操作 员 返 回 结果 。 操作 员 所 做 的 工作 就 是 把 这 些 资 
料 输入 到 计算 机 的 海量 存储 器 , 然后 由 称 为 操作 系统 的 程序 从 那里 一 次 一 个 地 读 入 并 执行 程序 。 
这 就 是 批 处 理 〈batch processing ) 的 开始 一 一 若干 个 要 执行 的 作业 收集 到 一 个 批 次 中 ， 然 后 执 
行 而 无 需 与 用 户 发 生 进一步 的 交互 。 

在 批 处 理 系 统 中 , 驻 留 在 海量 存储 器 的 作业 在 作业 队列 (job queue) 里 等 待 执 行 ( 见 图 3-1)。 
队列 〈queue) 是 一 种 存储 机 构 ， 对 象 〈 这 里 指 作业 ) 按照 先进 先 出 〈first-in，first-out，FIFO) 
的 方式 在 队列 里 排队 。 也 就 是 说 ， 对 象 的 出 列 顺序 和 入 列 顺 序 一 致 。 实 际 上 ， 大 多 数 作 业 队 列 


起 
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个 是 产 格 胆 循 FIFO 结 构 的 ， 主 要 是 因为 大 多 数 操作 系统 都 考虑 了 作业 的 优先 级 ， 结 果 就 造成 了 
在 队列 中 等 待 的 作业 有 可 能 被 优先 级 更 高 的 作业 挤 掉 。 





图 3-1 批 处 理 


在 年 期 的 批 处 理 系统 中 ， 每 个 作业 都 伴随 着 一 组 指令 ， 用 来 说 明 为 这 个 特定 的 作业 准备 机 
铝 时 所 需 的 步骤 。 这 些 指令 用 系统 能 识别 的 作业 控制 语言 (JCL) 进行 编码 ， 与 作业 一 起 存放 
在 作业 队列 里 。 当 一 个 作业 被 选中 执行 时 ， 操 作 系 统 在 打印 机 上 打印 出 这 些 指令 以 便 计 算 机 提 
作 员 图 读 和 遵照 执行 。 在 今天 ， 计 算 机 操作 员 与 操作 系统 之 间 的 通信 还 能 看 到 ， 如 报告 “没有 
拨号 音 “、“ 磁 盘 驱 动 不 可 访问 ”和 “打印 机 没有 响应 ”之 类 的 错误 的 PC 操作 系统 。 

在 计算 机 和 用 户 之 间 ， 用 计算 机 操作 员 作 为 媒介 的 最 大 缺点 是 :作业 一 旦 提交 给 操作 员 ， 
用 户 怠 与 它 无 法 交互 。 这 种 方法 对 于 某 些 应 用 是 可 以 接受 的 ， 如 工资 表 的 处 理 ， 因 为 在 这 里 ， 
数据 与 所 有 的 处 理 决策 事先 已 经 建立 了 。 然 而 ， 当 在 一 个 程序 的 执行 期 间 ， 用 户 必须 与 该 程序 
进行 交互 时 ， 这 种 方法 就 无 法 接受 了 。 例 如 ， 在 预订 系统 中 ， 预 订 和 取消 操作 必须 及 时 报告 ， 
在 子 处 理 系统 中 ， 文 档 是 以 动态 的 写 入 和 重 写 方式 开发 的 ， 在 计算 机 游戏 中 ， 与 计算 机 的 交互 
性 是 游戏 的 主要 特征 。 

123 为 了 适应 这 些 需 求 ， 开 发 了 新 的 操作 系统 ， 它 们 允许 执行 一 个 程序 来 实现 通过 远程 终端 与 
用 户 对 话 一 一 这 种 特性 称 为 交互 式 处 理 (interactive Processing)〈 见 图 3-2)。( 一 个 终端 是 由 稍 才 
于 一 台电 子 打字 机 组 成 的 ， 通 过 电子 打字 机 用 户 能 够 进行 输入 并 且 读 出 那些 打印 在 纸 上 的 计算 
仙 归 应。 当今 的 终端 已 经 演变 成 称 为 工作 站 的 设备 ， 这 些 设备 更 为 精细 复杂 ， 终 端 在 需要 时 其 
至 还 可 以 是 一 人 台 完 全 独立 运行 的 完整 个 人 电脑 。) 

成 功 的 交互 式 处 理 的 最 重要 之 处 在 于 ， 计 算 机 的 动作 更 快速 ， 能 够 协调 用 户 的 需求 ， 而 不 
年 让 用 户 完 全 遵循 计算 机 的 时 间 表 。( 在 进行 工资 表 的 处 理 任 务 时 ,计算 机 能 够 根据 所 需 的 时 间 
量 调度 得 很 好 ， 但 是 在 使 用 字 处 理 程序 时 ， 如 果 机 器 不 能 敏捷 地 对 字符 的 打印 做 出 响应 ， 用 户 
会 很 诅 次 。) 从 某 种 意义 上 说 ， 计 算 机 在 一 个 限期 内 被 强制 执行 任务 ， 这 一 过 程 就 是 众所周知 的 
实时 处 理 〈real-time processing )， 并 且 动 作 的 完成 也 是 按 实时 方式 发 生 的 。 也 就 是 说 ， 要 是 说 
计 鼻 机 以 实时 的 方式 完成 一 个 任务 就 意味 着 ， 计 算 机 完成 任务 的 速度 足以 跟 上 该 任务 所 在 的 外 
部 《现实 世界 ) 环境 中 的 行为 。 


柱 序 、 数 据 、 指 令 和 结果 


中 


用 万 城 


机 器 域 





图 3-2 ” 侈 互 式 处 理 
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如 果 要 求 交 互 式 系统 一 次 只 服务 于 一 个 用 户 ， 那 么 实时 处 理 就 不 存在 问题 了 。 但 是 在 20 世 
纪 六 、 七 十 年 代 ， 计 算 机 比较 晶 贵 ， 因 此 每 台 计 算 机 不 得 不 服务 于 多 个 用 户 。 因 此 ， 工 作 在 终 
凯 的 大 干 个 用 户 在 同一 时 间 寻 求 一 台 机 器 的 交互 式 服务 ， 并 且 对 实时 的 要 求 出 现 障碍 就 不 足 为 
奇 了 。 如 果 操 作 系统 对 于 多 用 户 环境 仍然 坚持 一 次 执行 一 个 作业 ， 那 么 将 只 有 一 个 用 户 接受 到 
满意 的 实时 服务 。 

针对 这 个 问题 的 解决 方案 就 是 设计 能 同时 给 多 个 用 户 提 供 服务 的 操作 系统 ， 这 一 特点 称 为 
分 时 〈time-sharing)。 实 现 分 时 的 一 种 方法 就 是 应 用 称 为 多 道 程序 设计 (multiprogramming) 的 
技术 ， 其 中 时 间 被 分 割 成 时 间 片 ， 每 个 作业 的 执行 被 限制 为 每 次 仅 一 个 时 间 片 。 在 每 个 时 间 片 
结束 时 ， 当 前 的 作业 暂时 放弃 执行 ， 允 许 另 一 个 作业 在 下 一 个 时 间 片 里 执行 。 通 过 这 种 方法 可 
以 快速 地 在 各 个 作业 之 间 进 行 切换 ， 形 成 了 若干 个 作业 同时 执行 的 错觉 。 依 据 所 执行 的 作业 的 
类 型 ， 早 期 的 分 时 系统 能 够 同时 为 多 达 30 个 用 户 提供 可 接受 的 实时 服务 。 今 天 ， 分 时 嫩 可 用 于 
单 用 户 系 统 ， 也 可 以 用 于 多 用 户 系 统 ， 前 者 通常 称 为 多 任务 (multitasking)， 是 指 同 时 可 以 实现 
多 个 任务 的 错觉 。 

随 着 多 用 户 的 发 展 ， 分 时 操作 系统 作为 一 种 典型 配置 ， 被 用 在 大 型 的 中 央 计 算 机 上 ， 用 来 
连接 大 量 的 工作 站 。 通 过 这 些 工 作 站 ， 用 户 能 够 从 机 房 外 面 直接 与 计算 机 进行 通信 ， 而 不 用 把 
请 求 递 区 给 计算 机 操作 员 。 通 常 把 要 用 到 的 程序 存储 在 计算 机 的 海量 存储 设备 上 ， 然 后 设计 的 
操作 系统 能 够 响应 工作 站 的 请 求 ， 执 行 这 些 程序 。 这 样 ， 作 为 计算 机 与 用 户 的 中 间 媒 介 一 - 计 
算 机 操作 员 的 作用 就 不 那么 明显 。 

到 今天 ， 特 别 是 在 个 人 计算 机 领域 ， 计 算 机 用 户 已 经 能 够 承担 计算 机 操作 的 所 有 职责 。 所 
以 ， 计 算 机 操作 员 在 事实 上 已 经 不 存在 了 ， 即 使 大 型 计算 机 系统 ， 其 运行 也 基本 上 勿 须 人 工 参 
与 。 事 实 上 ， 传 统 的 计算 机 操作 员 已 经 让 位 于 系统 管理 员 ， 系 统管 理 员 管理 计算 机 系统 ， 获 得 
和 监控 计算 机 新 设备 和 软件 的 安装 ， 管 理 一些 本 地 的 规则 ， 例 如 建立 新 的 账号 ， 为 不 同 的 用 户 
划分 一 定 的 存储 容量 ， 协 调用 户 一 起 解决 系统 中 出 现 的 问题 ， 这 样 就 比 纯 手工 方式 操作 计算 机 
要 好 得 多 。 

总 之 ， 操 作 系 统 已 经 从 简单 的 一 次 获取 和 执行 一 条 程序 发 展 为 复杂 的 ， 能 够 分 时 处 理 ， 能 
够 党 理 计 算 机 的 海量 存储 设备 上 的 程序 和 数据 文件 ， 并 能 直接 回应 计算 机 用 户 的 请 求 的 系统 。 

但 是 ， 计 算 机 操作 系统 的 发 展 仍 在 继续 。 多 处 理 器 的 发 展 已 经 能 够 让 操作 系统 进行 多 任务 
处 理 ， 操 作 系统 把 不 同 的 任务 分 配给 不 同 的 处 理 器 进行 处 理 ， 而 不 再 采用 分 时 机 制 共享 单个 处 
理 器 。 操 作 系 统 必 须 处 理 负载 平衡 (load balancing) (动态 地 把 任务 分 配给 各 个 处 理 器 ， 使 得 所 
有 的 处 理 器 都 得 到 有 效 的 利用 ) 和 均 分 〈scaling) (把 大 的 任务 划分 为 若干 个 子 任务 ， 并 与 可 用 
的 处 理 器 数目 相 适 应 ) 问题 。 

此 外 ， 计 算 机 网 络 的 出 现 〈 在 网 络 中 物理 距离 很 远 的 大 量 计算 机 连接 在 一 起 ) 使 得 有 必要 
发 展 相应 的 软件 系统 来 规范 网 络 的 行为 。 计 算 机 网 络 领域 (我 们 将 在 第 4 章 学 习 这 部 分 内 容 ) 在 
许多 方面 拓展 了 操作 系统 这 个 学 科 ， 其 目标 是 开发 一 个 单纯 的 网 络 范围 的 操作 系统 ， 而 不 是 一 
人 小 基于 个 人 操作 系统 的 网 络 。 

操作 系统 的 另外 一 个 研究 方向 ， 即 为 像 PDA 一 样 的 小 型 手持 计算 机 开发 系统 。 存 储 容量 的 
限制 和 电量 保存 的 需求 迫使 开发 者 要 再 次 检查 操纵 系统 执行 任务 的 方式 。 在 这 些 努力 中 ， 有 代 
表 性 的 成 功 系 统 有 : VxWORKS， 它 由 Wind River 系 统 开发 ， 用 在 称 为 “精神 和 机 会 ”的 火星 探 
索 旅 程 中 , Windows CE( 也 就 是 众所周知 的 Pocket PC), 它 由 微软 开发 :Palm OS， 它 由 PalmSource 
公司 开发 ， 主 要 用 在 PDA 上 。 
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问题 与 练习 
1. 举 出 风 个 队列 的 例子 。 对 于 每 一 种 情况 ， 请 指出 任何 可 能 破坏 FIFO 结 构 的 情况 。 
2. 下 列 任 务 中 哪些 需要 用 到 实时 处 理 技 术 ? 
a. 打印 邮件 列表 
b. 于 计算 机 孵 戏 。 
c. 在 键盘 上 键入 字母 的 同时 ， 把 这 些 字母 显示 在 监视 器 屏幕 上 。 
d. 执行 一 个 预报 下 一 年 经 济 状况 的 程序 。 
e。 播 放 MP3 录 音 。 
3. 实时 处 理 与 交互 式 处理 的 区 别 是 什么 ? 
4. 分 时 处 理 与 多 任务 处 理 的 区 别 是 什么 ? 


和 和 FE 有人 FF 民 芝 下村 秆 全 丰 鸭 和 下 机 相亲 全 Wo 生 二 ME 各 和 wu 
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为 了 能 够 理解 一 个 典型 的 操作 系统 的 组 成 ， 这 里 ， 我 们 首先 考虑 一 个 典型 的 计算 机 系统 中 
有 哪些 软件 ， 软 件 是 如 何 分 类 的 ， 然 后 我 们 再 回 到 操作 系统 上 来 。 


3.2.1 软件 概述 


我 们 通过 提出 一 个 软件 分 类 方案 考察 一 个 典型 的 计算 机 系统 中 找到 的 软件 。 这 种 分 类 方案 
已 是 把 一 些 类 似 的 软件 单元 放 在 不 同 的 类 里 ， 其 方法 如 同时 区 的 划分 。( 时 区 的 划分 使 得 相 邻 时 
区 的 设置 相差 一 小 时 , 即使 其 日 出 与 日 落 的 时 间 没 有 明显 的 差别 。) 其 次 ， 在 软件 分 类 的 情况 下 ， 
学科 的 发 展 变化 和 某 种 权威 的 缺乏 ， 导 致 了 一 些 矛 盾 的 分 类 方法 。 例 如 ， 微 软 公 司 的 Windows 
操作 系统 的 用 户 会 发 现 “ 附 件 ” 和 “管理 工具 ”程序 组 ， 它 们 既 包 括 应 用 类 软件 又 包括 实用 类 
钦 件 。 所 以 ， 下 面 的 分 类 方法 应 该 被 看 作 广泛 的 、 动 态 的 学 科 里 占有 一 席 之 地 的 工具 ， 而 不 是 
看 作 普 遍 接受 的 事实 的 一 种 表述 。 

先 把 计算 机 软件 分 为 两 大 类 : 应 用 软件 (application software) 和 系统 软件 〈system software) 
《参见 图 3-3)。 应 用 软件 是 由 一 些 完成 计算 机 的 特定 任务 的 程序 组 成 的 。-- 台 用 来 维护 某 个 制造 公 
司库 存单 的 计算 机 所 包含 的 应 用 软件 与 电气 工程 师 用 的 计算 机 里 所 找到 的 软件 是 不 同 的 。 应 用 软 
件 的 例子 有 电子 制 表 软 件 、 数 据 库 系 统 、 桌 面 出 版 系统 、 记 账 系统 、 程序 开发 软件 以 及 游戏 等 。 


软件 
应 用 系统 
: 用 软 逢 操作 系统 
外 过 内 炉 
图 3-3 ”软件 分 类 


相对 于 应 用 软件 而 言 ， 系 统 软件 完成 一 般 的 计算 机 系统 都 需要 完成 的 任务 。 在 某 种 意义 上 ， 
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系统 软件 提供 了 应 用 软件 所 需要 的 基础 架构 ， 这 和 国家 基础 架构 〈 政 府 、 道 路 、 公共 设施 、 金 
融 机 构 等 ) 提供 公民 维系 各 自生 活 方式 的 基础 的 方式 大 致 相同 。 

系统 软件 又 可 分 两 类 ， 一 类 是 操作 系统 本 身 ， 另 一 类 是 统称 为 实用 软件 〈utility software) 
的 软件 单元 。 大 多 数 安 装 的 实用 软件 包括 一 些 程 序 ， 这 些 程序 实现 的 活动 仅仅 是 计算 机 的 安 艾 
的 基础 ， 而 没有 包含 在 操作 系统 中 。 从 某 种 意义 上 说 ， 实 用 软件 是 由 一 些 能 够 扩充 《或 定制 ) 
操作 系统 功能 的 软件 单元 组 成 的 。 举 例 来 说 ， 格 式 化 磁盘 或 将 文件 从 磁盘 复制 到 光盘 中 去 的 能 
力 仅仅 是 借助 于 实用 软件 ， 而 不 是 在 操作 系统 内 部 实现 的 。 其 他 的 实用 软件 的 例子 包括 数据 讨 
缩 与 解压 缩 软件 、 多 媒体 播放 软件 和 处 理 网 络 通信 的 软件 。 

把 某 些 工 作 交 作为 实用 软件 来 实现 ， 允 许 定制 系统 软件 ， 这 比 把 它们 交 给 操作 系统 来 执行 
要 更 容易 适合 特定 安装 的 需求 。 事 实 上 ， 一 些 公司 和 个 人 对 原先 和 计算 机 操作 系统 一 起 提供 的 
实用 软件 进行 修改 和 扩充 ， 已 经 是 很 普通 的 事情 了 。 

遗憾 的 是 ， 应 用 软件 与 实用 软件 之 间 的 差别 已 经 很 模糊 。 从 我 们 的 观点 来 看 ， 它 们 的 差别 在 
于 其 是 否 是 计算 机 软件 架构 的 一 部 分 。 所 以 ， 当 新 的 应 用 变 成 了 一 种 基础 的 工具 ， 那 么 这 个 应 用 
就 很 可 能 成 为 一 种 实用 软件 。 当 用 于 因特网 的 通信 软件 还 在 研究 阶段 时 ， 它 就 被 认为 是 一 种 应 用 
软件 ， 而 在 今天 ， 像 这 样 的 对 PC 机 应 用 而 言 非常 基础 的 工具 软件 ， 也 就 被 定义 为 了 实用 软件 。 


LImUX 


对 于 计算 机 爱好 者 而 言 ， 如 果 想 通过 亲手 的 实验 来 了 解 一 个 操作 系统 ， 那 么 ， 就 应 该 
选择 Linux。 最 初 的 Linux 操 作 系 统 是 由 Linux Torvalds 在 赫尔辛基 大 学 守 习 期 间 设 计 完 成 的 。 
Linux 操 作 系统 是 一 个 非 专利 产品 ， 我 们 可 以 免费 获得 它 的 源 代 码 和 相关 文档 【 见 第 6 章 )， 
因为 它 可 以 免费 获得 ， 所 以 该 系统 在 计算 机 爱好 者 和 学 习 操 作 系 统 的 学 生 中 非常 流行 。 而 
且 ，Linux 操 作 系 统 被 认为 是 当今 可 用 的 最 可 靠 的 操作 系统 之 一 。 正 因为 这 个 原因 ， 一 些 公 
司 以 更 实用 的 形式 包装 和 销售 Linux 操 作 系 统 产品 ,现在 这 些 产 品 开始 向 市 场 上 长 期 被 认可 
的 商用 操作 系统 产品 发 出 了 挑战 。 我 们 可 以 在 http:Wwww.linux.org 这 个 网 站 了 解 更 多 有 关 
Linux 的 知识 。 


实用 软件 和 操作 系统 的 差别 同样 是 模糊 的 。 特 别 是， 美国 和 欧洲 的 反 董 断 诉讼 案 争 论 的 都 
是 这 样 一 个 问题 : 浏览 器 和 媒体 播放 器 这 两 个 组 件 是 微软 公司 操作 系统 的 一 部 分 ， 还 是 微软 公 
司 用 来 压制 竞争 对 手 的 实用 软件 。 


3.2.2 ”操作 系统 组 件 


现在 ， 我 们 把 注意 力 集中 在 操作 系统 领域 内 的 组 件 上 。 为 了 完成 计算 机 用 户 请 求 的 动作 ， 
操作 系统 必须 能 够 与 这 些 用 户 进行 通信 ， 那 么 ， 操 作 系统 处 理 通 信 的 这 一 部 分 ， 通 常 称 为 外 这 
(shell)， 这 里 的 “外 壳 ” 一 般 指 的 是 命令 解释 程序 。 原 来 的 外 壳 是 借助 图 形 用 户 界 面 〈graphical 
user interface，GUI， 读 作 “GOO-ee”) 来 实现 与 用 户 的 通信 的 。 利 用 图 形 用 户 和 界面 ， 像 文件 和 
程序 这 样 要 操作 的 对 象 ， 可 以 用 图 标的 形式 形象 地 在 监视 器 上 显示 出 来 。 这 些 系统 允许 用 户 使 
用 鼠标 并 通过 点 击 ， 指 向 图 标 来 发 出 命令 。GUI 经 常 被 称 为 WIMP 〈 窗 口 、 图 标 、 菜 单 和 指针 ) 
界面 ， 这 是 基于 它 的 组 成 部 分 的 。 当 今 的 GUI 使 用 二 维 图 像 投 影 系 统 ， 三 维 立 体 界 面 允 许 用 户 
通过 3D 投 影 系 统 、 知 觉 设 备 和 环绕 音频 再 生 系统 与 计算 机 进行 通信 ， 它 是 当前 研究 的 课题 。 

虽然 操作 系统 的 外 壳 在 实现 计算 机 的 功能 上 扮演 了 重要 的 角色， 但 是 ， 外 竞 仅仅 是 用 户 与 
操作 系统 内 核 之 间 的 一 个 接口 而 已 〈 见 图 3-4)。 外 壳 与 操作 系统 内 部 之 间 的 区 别 的 呈现 是 因为 
这 样 一 个 事实 ， 即 一 些 操作 系统 允许 特定 用 户 从 各 种 外 壳 中 选择 最 合适 的 接口 为 自己 服务 。 例 
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< 轴 ” 和 了 一 一 一 


如 ，UNIX 操 作 系统 的 用 户 就 可 以 选择 不 同 的 外 壳 ， 包括 Borm 外 元 、 C 外 壳 和 Korm 外 壳 等 。 而 且 ， 
微软 公司 的 Windows 操 作 系统 的 早期 版 本 本 质 上 就 是 替换 了 基于 文本 的 外 元 (当前 与 操作 系统 
-- 起 使 用 ， 称 为 带 有 GUI 外 壳 的 MS-DOS) 构建 的 ， 操作 系统 的 底层 仍然 保留 了 MS-DOS。 


用 户 





让 人 
呈 本 二 二 
和 ER 0 
天 用 户 


图 3-4 ”作为 用 户 和 操作 系统 内 核 之 间 的 外 沈 


今天 的 GUI 外 壳 中 的 重要 组 件 是 窗口 管理 程序 《window manger )， 该 程序 在 屏幕 上 分 配 若 
干 块 被 称 为 窗口 的 区 域 ， 并 且 跟 踪 与 每 个 窗口 相 联系 的 应 用 程序 。 当 一 个 应 用 程序 想 在 屏幕 上 
显示 图 像 时 ， 它 就 会 通知 窗口 管理 和 程序， 这样， 窗口 管理 程序 就 会 把 图 像 放 在 分 配给 该 应 用 程 
序 的 窗口 里 。 然 后 ， 当 点 击 鼠 标 时 ， 窗 口 管理 程序 计算 鼠标 的 位 置 ， 并 把 这 个 鼠标 位 置 通知 给 
相应 的 应 用 程序 。 

与 操作 系统 的 外 壳 相 对 ， 我 们 把 操作 系统 内 部 的 部 分 称 为 内 核 (kernel)。 操 作 系 统 的 内 核 
包含 一 些 完成 计算 机 安装 所 要 求 的 基本 功能 的 软件 组 件 。 其 中 一 个 组 件 是 文件 管理 程序 〈file 
manager)， 它 的 工作 是 协调 计算 机 与 海量 存储 器 设施 的 使 用 。 更 准确 地 说 ， 文件 管理 程序 保存 
了 存储 在 海量 存储 器 上 的 所 有 文件 的 记录 ， 包 括 每 个 文件 的 位 置 、 哪些 用 户 有 权 进 行 访 问 以 及 
海量 存储 器 里 的 哪 部 分 可 以 用 来 建立 新 文件 或 扩充 现 有 文件 。 这 些 记 录 被 存放 在 单独 的 与 相关 
的 文件 相连 的 存储 介质 中 ,， 这样， 每 次 存储 介质 启动 时 ， 文 件 管理 程序 就 能 够 检索 相关 的 文件 ， 
进而 就 能 知道 特定 的 存储 介质 中 存放 的 是 什么 。 

为 了 方便 计算 机 用 户 ， 大 多 数 文件 管理 程序 都 允许 把 若干 个 文件 组 织 在 一 起 ， 放 在 目录 
(directory) 或 文件 夹 (folder) 里 。 这 种 方法 允许 用 户 将 自己 的 文件 ， 依 据 用 途 划 分 ， 把 相关 的 
文件 放 在 同一 个 目录 里 。 而 且 ， 一 个 目录 可 以 包含 称 为 子 目 录 的 其 他 目录 ， 这 样 就 可 以 构建 层 
次 化 的 目录 结构 。 例 如 ， 用 户 可 以 创建 一 个 名 为 MyRecorads 的 目录 ， 它 又 包含 了 名 为 
FinancialRecords、 MedicalRecoras 和 HouseHoldRecords 的 3 个 子 目 录 。 每 个 子 目 录 中 
都 会 有 属于 该 范畴 的 文件 。(Windows 操 作 系统 的 用 户 能 通过 执行 Windows 资 源 管理 器 程序 ， 让 
文件 管理 程序 显示 当前 所 有 的 目录 结构 .) 

一 条 由 目录 内 的 目录 所 组 成 的 链 称 之 为 目录 路 径 (directory path )， 路 径 通 常 是 这 样 表示 的 ， 
列 出 沿 访 路径 的 目录 ， 然 后 用 斜 杠 分隔 它们 。 例 如 ， 路 径 animals/prehistoric/ydlnosaurs 
表示 的 是 ;该 路 径 是 从 目录 名 为 animals 的 目录 开始 的 ， 经 过 名 为 prehistoric 的 子 目录 ， 终 
止 于 名 为 ainosaurs 的 子 目录 《〈 该 子 目录 是 相对 于 Prehistoric 月 录 而 言 )。( 对 于 Windows 用 
户 而 言 ， 目 录 路 径 是 用 反 斜 杠 表示 的 ， 如 animals\prehistoricvdinosaurs。) 

其 他 软件 实体 对 文件 的 任何 访问 都 是 由 文件 管理 程序 来 实现 的 。 该 访问 过 程 是 这 样 开始 的 ， 
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先 通 过 一 个 称 为 打开 文件 的 过 程 来 请 求 文件 管理 程序 授权 访问 该 文件 ， 如 果 文 件 管理 程序 批准 
了 该 访问 请 求 ， 那 么 它 就 会 提供 查找 和 操纵 该 文件 所 需 的 信息 。 这 些 信息 存储 在 主 存储 器 中 的 
一 个 称 为 文件 描述 符 (file descriptor) 的 区 域 里 。 对 文件 的 各 种 操作 都 是 通过 引用 这 个 文件 描述 
符 里 的 信息 完成 的 。 

- 内 核 的 另外 一 个 组 件 是 一 组 设备 驱动 程序 (device driver)。 它 们 是 负责 与 控制 器 【有 时 直 
接 与 外 围 设备 ) 通信 ， 以 实现 对 连接 到 计算 机 的 外 围 设备 的 操作 的 软件 组 件 。 每 个 设备 驱动 程 
序 是 专门 为 特定 类 型 的 设备 〈 如 打印 机 、 磁 盘 了 驱动器 和 显示 器 等 ) 设计 的 ， 它 把 - - 般 的 请 求 翻 
详 为 这 种 设备 〈 分 配给 这 个 驱动 程序 的 ) 所 需要 的 较为 适用 的 步骤 。 例 如 ， 打印 机 的 设备 驱动 
程序 包含 的 软件 能 够 读 取 和 解码 特定 打印 机 的 状态 字 ， 而 且 还 能 够 处 理 其 他 一 些 信息 交换 的 细 
节 。 这 样 ， 其 他 软件 组 件 就 没有 必要 为 了 打印 一 个 文件 而 去 处 理 这 些 技 术 细节 ， 而 只 需要 运用 
发 备 驱动 程序 软件 去 完成 打印 文件 的 任务 即 可 ， 技 术 细节 交 由 设备 驱动 程序 去 处 理 。 按照 这 种 
方式 ， 其 他 软件 组 件 的 设计 可 以 独立 于 具体 设备 特有 的 特征 。 这 样 做 的 结果 是 ， 一 个 普通 的 操 
作 系 统 能 够 使 用 一 些 特殊 外 围 设 备 ， 我 们 只 需 安装 合适 的 设备 驱动 程序 即 可 。 

企 操作 系统 中 ,还 有 一 个 组 件 就 是 内 存 管理 程序 (memory manager)， 它 主要 担负 着 协调 和 
管理 计算 机 所 使 用 的 主 存 储 器 的 任务 。 在 计算 机 一 次 执行 一 个 任务 的 环境 中 ， 这 些 工 作 就 比较 
简单 了 。 这 些 情 况 下 ， 执 行当 前 任务 的 程序 放 在 主 存储 器 中 己 经 定义 好 的 位 置 上 执行 ， 然 后 用 
执行 下 一 个 任务 的 程序 替换 它 。 然 而 ， 在 多 用 户 和 多 任务 的 环境 下 ， 要 求 计 算 机 在 同一 时 刻 能 
够 处 理 多 个 需求 ， 这 时 ， 内 存 管理 程序 的 职责 就 扩展 了 。 在 这 些 情 况 下 ， 许多 程序 和 数据 块 必 
顷 同 时 驻 留 在 内 存 里 ， 因 此 ， 内 存 管 理 程序 必须 找到 并 给 这 些 需 求 分 配 内 存 空 间 ， 并 且 要 保证 
每 个 程序 只 能 限制 在 程序 所 分 配 的 内 存 空 间 内 运行 。 而 且 ， 随 着 不 同 的 活动 的 需求 进出 内 存 ， 
内 存 管理 程序 必须 能 跟踪 那些 不 再 被 占用 的 内 存 区 域 。 

当 所 需 的 总 内 存 空间 超过 该 计算 机 实际 所 能 提供 的 可 用 内 存 空间 时 ， 内 存 管理 程序 的 任务 
到 复杂 得 和 多。 在 这 种 情况 下 ， 内 存 管理 程序 通过 在 内 存 与 海量 存储 器 之 间 来 回 切 换 程 序 和 数据 
块 《〈 称 之 为 页 面 调 度 (paging))， 这 样 就 造成 了 有 额外 的 内 存 空 间 的 假象 。 例 如 ， 假设 需要 一 
区 1024 MB 的 内 存 空间 ， 但 是 计算 机 所 能 提供 的 只 有 512 MB 。 为 了 造成 具有 更 大 内 存 的 假象， 
内 存 管理 程序 在 磁盘 上 预 留 了 1024 MB 的 存储 空间 。 在 这 块 存储 区 域 里 ， 将 记录 1024 MB 内存 
容量 需要 存储 的 位 模式 。 这 块 数据 区 被 分 成 大 小 一 致 的 存储 单元 ， 傍 和 仓储 单元 称 之 为 页 面 
(pages)， 典 型 的 页 面 大 小 只 有 几 千 字 节 。 于 是 ， 内 存 管理 程序 就 在 主 存 和 海量 存储 器 之 间 来 回 
切换 这 些 页 面 。 这 样 ， 在 任何 给 定 的 时 间 内 ， 我 们 所 需 的 页 面 都 会 出 现在 512 MB 的 内 存 之 中 ， 
最 后 的 结果 是 计算 机 能 够 像 确 实 拥有 1024 MB 内 存 -一 样 工 作 。 这 氛 由 分 页 技术 所 产生 的 大 的 “ 虚 
构 的 ”内 存 空间 被 称 作 虚 拟 内 存 〈virtual memory )。 

尺 外 ， 在 操作 系统 内 核 中 还 有 调度 程序 (scheduler) 和 分 派 程序 (dispatcher) 这 两 个 组 件 ， 
我 们 将 在 下 一 节 介 绍 。 至 此 ， 我 们 只 是 需 注 意 ， 在 分 时 系统 中 ， 调度 程序 决定 哪些 活动 是 可 以 
执行 的 ， 而 分 派 程序 控制 给 这 些 活动 的 时 间 分 配 。 


3.2.3 ”系统 启动 


我 们 已 经 可 以 看 出 ， 操 作 系统 提供 了 其 他 软件 组 件 所 需 的 软件 基础 设施 ， 但 是 ， 我 们 还 没 
有 细 想 操作 系统 本 身 是 如 何 启动 的 。 这 是 通过 一 个 称 为 引导 (boot strapping， 简称 为 booting ) 
的 过 程 实现 的 ， 这 个 过 程 是 由 计算 机 在 每 次 启动 的 时 候 完成 的 。 正 是 这 个 过 程 把 操作 系统 从 海 
量 仓储 器 《和 它 永 久 存放 的 地 方 ) 传送 到 主 存储 器 〈 在 开机 时 ， 内 存 实际 上 是 空 的 ) 中 。 为 了 理 
解 月 动 过程 和 必须 有 启动 过 程 的 原因 ， 我 们 从 考察 计算 机 的 CPU 开始 。 

CPU 的 设计 使 得 每 次 CPU 启动 时 它 的 程序 计数 器 从 事先 确定 的 特定 地 址 开始 。CPU 就 在 这 
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个 地 址 上 期 望 能 找到 程序 要 执行 的 第 一 条 指令 。 从 概念 上 讲 ， 所 需要 的 一 切 就 是 在 这 个 地 址 上 
存储 操作 系统 。 然 而 ， 从 经 济 和 效率 的 原因 上 讲 ， 计 算 机 的 主 存 是 采用 易 失 性 技术 制造 的 : 当 
计算 机 关闭 时 ， 也 就 意味 着 存储 在 内 存 上 的 数据 会 于 失 。 这 样 ， 在 每 次 重 忆 计算 机 的 时 候 ， 我 . 
们 就 需要 一 种 重新 充满 主 存 的 方法 。 

何 言 之 , 当 计 算 机 让 族 打 开 时 , 我 们 需要 在 主 存储 器 中 提交 一 个 程序 (更 适宜 的 操作 系统 )， 
但 是 每 次 关机 后 ， 计 算 机 中 不 稳定 的 存储 器 都 要 被 清除 。 为 了 解决 这 个 两 难 问 题 ， 计 算 机 的 一 
小 部 分 主人 存 器 驶 用 非 易 失 性 记忆 体 的 特殊 单元 建造 ， 而 这 地 方正 是 CPU 期 望 找到 它 的 初始 化 程 
序 的 地 方 。 由 于 这 种 存储 器 的 内 容 可 以 读 取 ， 但 不 可 以 改变 ， 因 而 被 称 为 只 读 存 储 器 〈ROM)。 
打 个 比方 ， 虽 然 所 使 用 的 技术 是 更 先进 的 ， 但 我 们 可 以 把 存储 在 ROM 中 的 存储 位 模式 想象 成 熔 
断 微 小 的 保险 丝 。 更 确切 地 说 ， 如 今 个 人 电脑 中 大 多 数 的 ROM 是 用 闪存 技术 构建 的 《 即 不 是 严 
格 意义 上 的 ROM， 因 为 它 可 以 在 特定 情况 下 被 改变 )。 

在 一 般 的 电脑 中 ， 称 之 为 引导 (bootstrap) 的 程序 是 永久 存储 在 机 器 的 ROM 中 的 。( 存 储 在 
ROM 的 程序 是 称 为 固件 〈firmware)， 反 映 出 这 样 一 个 事实 ， 即 它 是 由 永久 记录 在 硬件 中 的 软件 
组 成 的 .) 这 样 ， 在 计算 机 开机 的 时 候 将 最 先 执行 这 个 程序 。 引 寻 程 序 的 任务 是 引导 CPU 把 操作 
系统 从 诲 量 仔 储 器 中 预先 定义 的 位 置 调 入 主人 存 的 可 变 人 存储 区 〈 如 图 3-$)。 一 旦 操作 系统 被 放 调 
入 主人 存 ， 引 寻 程 序 蜀 引导 CPU 执行 跳 转 指令 ， 转 到 这 个 存储 区 。 这 时 ， 操 作 系 统 接管 并 开始 控 
制 计算 机 的 活动 。 执 行 引 寻 和 开始 操作 系统 的 整个 过 程 称 作 启 动 (booting) 计算 机 。 


上 存储 问 E 存 人 情 器 





磁盘 存储 器 

ov- 引导 程序 sov 了 | 引导 程序 磁盘 存储 器 
| “操作 系统 -二 

易 失 存 
易 失 存储 区 

操作 系统 操作 系统 

步骤 1， 机 器 由 执行 已 在 存储 器 中 的 引导 程序 开 步骤 2， 引 导 程 序 把 操作 系统 传送 到 主 存储 器 中 ， 
始 。 操 作 系 统 存放 在 海量 存储 器 中 并 把 控制 权 交 给 它 
图 3-$ 引导 过 程 


你 也 许 在 想 ， 为 什么 计算 机 不 提供 足够 的 ROM 来 装载 整个 的 操作 系统 呢 ， 这 样 从 海量 存储 器 
来 引导 启动 就 没有 必要 了 ? 答案 是 ， 就 当今 的 技术 而 言 ， 把 通用 计算 机 的 大 块 主 存 专用 于 不 可 变 
的 存储 ， 效 率 就 不 高 了 。 另 一 方面 ， 像 家 用 电器 中 使 用 的 大 多 数 专用 计算 机 ， 如 果 让 它们 所 有 的 
软件 都 常 驻 内 存 ， 那 么 每 次 设备 开启 时 用 起 来 就 比较 方便 。 由 于 很 容易 通过 轻 击 一 个 键 就 能 使 系 
统 开 始 工 作 ， 所 以 我 们 将 这 样 的 系统 称 为 交 铀 匙 系统 〈tum key systems)。 随 着 存储 技术 的 快速 发 
展 ， 引 导 过 程 中 的 许多 步骤 可 能 很 快 就 会 过 时 ， 并 且 通 用 计算 机 都 将 达到 交 钥 匙 的 状态 。 

最 后 ， 我 们 应 该 指出 理解 引导 过 程 以 及 操作 系统 、 工 具 软 件 和 应 用 软件 之 间 的 区 别 ， 能 帮助 我 
们 更 好 地 领会 全 面 的 方法 学 ， 其 中 大 多 数 通 用 计算 机 系统 操作 都 在 方法 学 之 下 运行 。 当 这 样 的 计算 
机 第 一 次 开机 时 ， 引 导 过 程 装 入 并 激活 操作 系统 。 然 后 用 户 向 操作 系统 提出 请 求 ， 执 行 实用 软件 和 
应 用 程序 。 当 实用 软件 或 应 用 程序 终止 时 ， 用 户 切断 与 操作 系统 的 联系 ， 这 时 用 户 能 提出 另 一 次 请 
求 。 因 此 ， 学 会 使 用 这 样 的 系统 是 一 个 双 层 过 程 ， 除 了 学 会 指定 实用 软件 或 期 望 的 应 用 软件 的 细节 
之 外 ， 还 必须 学 会 足够 多 的 关于 计算 机 操作 系统 的 知识 ， 以 便 能 在 应 用 软件 之 间 游 丸 有 余 。 - 
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除了 引导 程序 外 ，PC 机 的 只 读 存 储 器 还 自 揪 了 一 组 倒 行程 序 ， 用 于 实现 基本 的 输入 / 输 
出 活动 ， 如 从 键盘 上 接收 信息 ， 把 信息 显示 在 计算 机 的 屏幕 上 ， 以 及 从 海量 存储 器 上 读数 据 
等 。 因 为 存放 在 ROM 里 ， 所 以 这 些 例 行 程序 可 以 被 引导 程序 使 用 ， 以 便 在 操作 系统 开始 工作 
前 能 完成 IO 活动 。 倒 如， 它们 会 在 引导 过 程 真正 开始 前 ， 用 于 与 计算 机 用 户 通信 ， 并 在 引导 
期 间 提交 错误 报告 。 这 些 所 有 的 例 行 程序 组 成 了 一 个 基本 输入 /输出 系统 (BIOS )， 这 样 ,BIOS 
这 个 本 语 仅仅 指 的 是 计算 机 的 ROM 中 的 一 部 分 软件 ， 而 在 今天。 这 小 本 语 广泛 用 于 指 存放 在 
ROM 中 的 整个 软件 组 ， 有 时 候 也 指 ROM 本 身 . 


问题 与 练习 

1 列 尘 真 型 操作 系统 的 组 件 ， 并 用 --- 句 话 概括 每 个 组 件 的 作用 。 
2. 应 用 软件 与 实用 软件 之 间 的 区 别 是 什么 ? 

3. 什么 是 虚拟 存储 器 ? 

4. 概述 引导 过 程 。 


3.3 协调 机 器 的 活动 
在 本 节 中 ， 我 们 讨论 操作 系统 是 如 何 协调 应 用 软件 、 实 用 软件 以 及 操作 系统 自身 内 部 单元 
的 执行 的 。 首 先 ， 从 进程 的 概念 开始 ， 


3.3.1 ”进程 的 概念 


现代 操作 系统 的 一 个 最 基本 的 概念 就 是 程序 与 执行 该 程序 的 行为 区 别 开 来 。 前 者 是 一 组 静 
态 的 指示 ， 而 后 者 是 一 动态 的 行为 ， 其 属性 会 随 着 时 间 的 推进 而 改变 。 我 们 把 这 种 行为 称 之 为 
进程 〈process)。 与 进程 联系 在 一 起 的 行为 的 当前 状态 ， 称 为 进程 状态 〈process state)。 这 个 状 
态 包含 正在 执行 的 程序 的 当前 位 置 ( 程 序 计 数 器 的 值 、 CPU 中 其 他 寄存 器 的 值 以 及 相关 的 存储 
单元 。 大 约 说 来 ， 进 程 状态 就 是 机 器 在 特定 时 刻 的 快照 。 在 程序 执行 期 间 的 不 同时 刻 〈 一 个 进 
程 中 的 不 同时 刻 )， 将 观察 到 不 同 的 快照 〈 不 同 的 进程 状态 )。 

在 典型 的 分 时 /多 任务 计算 机 系统 中 ， 许多 进程 通常 会 竞争 计算 机 资源 。 而 操作 系统 的 任务 
不 是 管理 这 些 进 程 ， 使 每 个 进程 都 能 获得 其 需要 的 计算 机 资源 外围 设备 、 主 存 空 间 、 访 问 文 
件 以 及 访问 CPU)， 确 保 独 立 进程 不 会 相互 干扰 ， 确保 需要 交换 信息 的 进程 能 够 进行 信息 交换 。 


3.3.2 ”进程 管理 


与 示 调 进程 的 执行 有 关 的 任务 是 由 操作 系统 内 核 中 的 调度 程序 和 分 派 程序 处 理 的 。 调 度 程 
序 维护 一 个 有 关 计 算 机 系统 中 现存 进程 的 记录 (也 就 是 进程 池 )》 将 新 的 进程 加 入 到 该 进程 池 中 ， 
并 拖 己 经 完成 的 进程 移出 进程 池 。 这 样 ， 当 用 户 请 求 执行 一 个 应 用 时 ， 调 度 程序 就 把 这 个 应 用 
加 到 当前 进程 池 加 以 执行 。 

为 了 中 踪 所 有 的 进程 ， 二 度 程序 在 主 存 中 维护 着 一 个 信息 块 ， 称 为 进程 素 〈process table ) 。 
等 当 要 请 求 程序 执行 时 ， 调 度 程序 都 在 进程 表 中 为 该 程序 创建 一 个 新 的 表 项 。 这 个 表 项 包含 下 
如 分 配给 该 进程 的 存储 区 这 样 的 信息 (由 内 存 管理 程序 得 到 )、 进 程 的 优先 级 以 及 该 进程 是 处 于 
中 络 状 态 还 是 等 待 状态 。 如 果 进 程 能 够 继续 执行 ， 那 么 该 进程 就 处 于 就 绪 (ready) 状态 ， 如 时 
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进程 因为 要 等 待 某 个 外 部 事件 的 发 生 而 中 断 ， 例 如 磁盘 的 竞争 访问 、 等 待 键盘 的 输入 以 及 等 待 
其 他 进程 传 来 的 消息 等 ， 那 么 该 进程 就 处 于 等 待 〈waiting) 状态 。 

分 派 程序 是 内 核 的 一 个 组 件 ， 它 确保 被 调度 的 进程 实际 被 执行 。 在 分 时 /多 任务 系统 中 ， 这 
个 任务 是 依靠 多 道 程序 设计 (multiprogramming) 来 完成 的 ， 也 就 是 说 ， 先 将 事件 划分 为 小 的 时 
间 段 ， 每 段 称 为 一 个 时 间 片 〈time slice) (通常 不 会 超过 50ms)， 然 后 把 CPU 的 注意 力 放 在 就 绪 
进程 上 ， 人 允许 每 个 进程 一 次 执行 一 个 时 间 片 〈 参 见 图 3-6)。 这 种 从 一 个 进程 到 另 一 个 进程 的 改 
变 过 程 称 之 为 进程 切换 〈process switch) 或 进程 上 下 文 切 换 〈context switch) 


中断 中 断 中 断 中 记 





进程 切换 进程 切换 





时 间 轴 十 一 一 一 二 一 一 一 才 一 一 一 一 -一 
时 间 片 时 间 片 时 间 片 





图 3-6 ”进程 A 与 进程 B 之 间 的 多 道 程序 设计 


每 次 ， 分 派 程序 给 进程 分 配 一 个 时 间 片 时 ， 它 都 会 初始 化 一 个 计时 器 电路 ， 通 过 产生 一 个 
中 断 〈interrupt) 信和 号 来 指示 时 间 片 的 结束 。CPU 对 中 断 信 号 的 响应 方法 就 如 同 你 被 一 个 任务 打 
断 时 的 应 对 方法 ， 你 停止 现在 正在 做 的 工作 ， 记 录 下 你 当前 任务 进展 的 位 置 〈 这 样 你 就 能 在 后 
面 的 时 间 返 回 到 被 中 断 的 工作 上 去 )， 然 后 去 处 理 中 断 事件 。 当 CPU 收 到 一 个 中 断 信 和 号 时 ， 它 会 
完成 当前 的 机 器 周期 , 保存 它 在 当前 进程 中 的 位 置 , 然后 就 开始 执行 称 为 中 断 处 理 程序 (interrupt 
handler) 的 程序 ， 该 程序 存放 在 主 存 中 的 预先 定义 的 位 置 上 。 中 断 处 理 程序 是 分 派 程序 的 一 部 
分 ， 筷 用 来 描述 分 派 程 序 如 何 响应 中 断 请 求 。 


中 ， 断 


中 断 是 用 来 终止 时 间 片 的 ， 正 如 本 文中 所 描述 的 一 样 ， 这 只 定 计 和 具 机 中 断 系 统 中 众多 应 
用 中 的 一 个 。 有 许多 可 以 产生 中 断 信 号 的 环境 ， 每 个 都 有 自己 的 相关 中 断 倒 穆 . 事实 上 ， 中 
靳 为 协调 计 民 机 的 活动 与 相关 环境 提供 了 一 个 重要 的 工具 。 例如， 点 击 和 鼠标 和 接 下 键盘 中 的 
一 个 按键 都 能 产生 一 个 中 断 信 号 ， 这 样 就 能 导致 CPU 放下 正在 处 理 的 工作 , 转 而 去 解决 中 断 . 

为 了 管理 识别 和 响应 引入 中 断 的 任务 ,不同 的 中 断 信号 赋予 了 不 同 的 优先 级 ; 这 样 一 来 ， 
了 最 重要 的 任务 最 先 得 到 执行 。 最 高 级 别 的 中 断 通常 与 电源 故障 有 关 ， 像 计算 机 电源 意外 中 汤 
而 广 生 的 中 断 信号 等 。 然 后 ， 在 几 毫 秒 时 间 内 ， 与 之 相关 的 中 断 处理 倒 程 赶 在 电压 降 到 不 能 
再 进行 操作 前 ， 引 导 CPU 完 成 一 系列 类 似 “ 家 务 活 ” 的 或 杂工 作 . 


于 和 是， 中 断 信 号 的 作用 就 是 取代 当前 进程 ， 将 控制 权 传 回 分 派 程序 。 在 这 一 点 上 ， 分 派 程 
序 首先 允许 调度 程序 更 新 进程 表 〈 例 如 ， 刚 完成 其 时 间 片 的 进程 可 能 要 降低 它 的 优先 级 ， 而 其 
人 进程 的 优先 级 可 能 要 提高 )。 然 后 ， 分 派 程序 从 进程 表 的 就 绪 队 列 中 选择 优先 级 最 高 的 进程 ， 
重 月 计时 器 电路 ， 使 被 选择 的 进程 开始 它 的 时 间 片 加 以 执行 。 
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分 时 系统 能 够 成 功 的 最 大 关键 是 能 够 停止 进程 ， 并 且 稍 后 能 重启 进程 。 如 果 你 在 读 一 本 书 的 
时 候 被 打 断 了 ， 那 么 你 能 否 具 有 稍 后 能 继续 读 的 能 力 则 依赖 于 你 是 否 记得 被 中 断 时 读 到 的 位 置 以 
及 你 对 那个 位 置 上 内 容 记 人 忆 的 能 力 。 简 而 言 之 , 你 必须 能 够 重新 建立 起 中 断 前 所 存在 的 那个 环境 。 

在 一 个 进程 的 情况 下 ， 必 须 重 新 建立 的 环境 就 是 进程 的 状态 。 回 想 一 下 ， 这 个 状态 包括 程 
序 计 数 器 的 值 以 及 寄存 器 和 相关 存储 单元 的 值 。 在 为 多 道 程序 设计 系统 设计 的 CPU 中 ， 保 存 这 
种 信息 的 任务 是 CPU 应 对 中 断 信号 的 工作 的 一 部 分 。 这 类 CPU 还 提供 机 器 语言 指令 ， 以 重新 装 
和信 先 前 你 存 的 状态 。 这 种 特性 简化 了 分 派 程序 完成 进程 切换 时 的 任务 ， 它 也 例证 了 现代 的 CPU 
习 计 是 如 何 受 当今 的 操作 系统 的 需求 影响 的 。 

在 本 节 结 束 时 ， 我 们 应 当 注 意 到 ， 多 道 程序 设计 的 使 用 是 建立 在 提高 计算 机 的 总 体 效 率 上 。 这 
有 氮 违 反 种 理 ， 因 为 多 道 程序 设计 要 对 进程 进行 来 回 切换 ， 会 产生 一 定 的 开销 。 但 是 ， 如 果 没 有 多 
追 程序 设计 处 理 技术 ， 那 么 每 个 进程 在 下 一 个 进程 开始 之 前 竞争 资源 ， 这 也 就 意味 着 那个 时 候 ， 进 
程 正在 等 外 围 设备 来 完成 任务 ， 或 者 对 用 户 而 言 ， 发 出 下 一 个 请 求 是 多 余 的 。 多 道 程序 设计 技术 可 
以 把 这 些 丢 失 的 时 间 给 其 他 进程 。 例 如 ， 如 果 一 个 进程 执行 JO 请 求 ， 如 向 磁盘 提出 读数 据 请 求 ， 
那么 调度 程序 就 会 更 新 进程 表 来 反映 出 这 个 进程 正在 等 待 外 围 设 备 。 结 果 是 ， 分 派 程序 将 终止 分 配 
给 该 进程 的 时 间 片 。 之 后 《也 许 是 几 百 毫秒 )， 当 IO 请 求 完成 时 ， 调 度 程 序 将 会 更 新 进程 表 来 显示 
该 进程 处 于 就 绪 状 态 ， 这 样 这 个 进程 就 可 以 重新 参与 竞争 时 间 片 。 简 而 言 之 ， 当 正在 执行 1JO 请 求 
时 ， 称 序 可 以 去 执行 其 他 的 任务 ， 那 么 ， 在 分 时 环境 下 ， 一 组 任务 的 完成 时 间 要 比 按照 顺序 方式 执 
行 所 花 的 时 间 少 。 


回 题 与 练习 

1. 概述 程序 和 进程 的 差别 。 

2. 概述 在 中 断 出 现时 ，CPU 所 要 完成 的 步骤 。 

3. 在 多 道 程序 设计 系统 中 ， 如 何 能 使 高 优先 级 的 进程 运行 得 比 其 他 的 进程 快 ? 

4. 在 一 个 多 道 程序 设计 系统 里 ， 如 果 每 个 时 间 片 是 50ms， 每 次 上 下 文 切换 所 花费 的 时 间 最 多 是 1us， 那 
么 计算 机 在 1s 内 能 能 服务 于 多 少 个 进程 ? 

5. 在 练习 4 中 ， 如 果 每 个 进程 都 完全 使 用 了 它 的 时 间 片 ， 那 么 实际 花费 在 进程 执行 上 的 时 间 占 整个 机 时 
时 间 的 比例 是 多 少 ? 如 果 每 个 进程 在 它 的 时 间 片 后 的 lus 执 行 IO 请 求 ， 那 么 这 个 比例 又 是 多 少 ? 


3.4 “处 理 进程 间 的 竞争 


操作 系统 的 一 个 重要 任务 就 是 将 机 器 的 各 种 资源 分 配给 系统 中 的 各 个 进程 。 从 广义 上 讲 ， 
我 们 所 用 的 资源 《〈resource) 这 个 术语 ， 不 仅 包括 机 器 的 外 围 设备 ， 还 包括 机 器 本 身 的 特性 。 文 
件 过 理 程序 分 配对 文件 的 访问 以 及 为 新 建立 的 文件 分 配 磁盘 空间 , 内 存 管理 程序 分 配 内 存 空间 ， 
调度 程序 分 配 进程 表 的 空间 ， 分 派 程序 分 配 时 间 片 。 正 如 计算 机 系统 里 的 许多 问题 一 样 ， 这 种 
分 配 任务 表面 上 看 起 来 很 简单 ， 实 际 上 ， 对 于 没有 设计 好 的 操作 系统 ， 几 个 微小 的 错误 将 导致 
系统 的 故障 。 要 记 住 ， 计 算 机 不 会 自己 思考 ， 它 仅仅 是 遵照 指令 办 事 。 所 以 ， 为 了 构建 一 个 可 靠 
的 操作 系统 ， 我 们 必须 开发 算法 ， 以 克服 各 种 可 能 出 现 的 意外 情况 ， 不 管 它 出 现 的 概率 有 多 小 。 


3.4.1 信和 号 量 


考虑 一 个 分 时 /多 任务 操作 系统 ， 它 控制 只 有 一 台 打 印 机 的 计算 机 的 活动 。 如 果 一 个 进程 要 
求 打印 它 的 结果 ， 那 么 它 必 须 向 操作 系统 提出 请 求 ， 要 求 访问 打印 机 设备 的 驱动 程序 。 这 个 时 
候 ， 操 作 系统 必须 根据 该 打印 机 是 否 被 其 他 的 进程 占用 来 决定 是 否 批准 这 个 请 求 。 如 果 没 有 使 
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用 ， 那 么 操作 系统 应 该 批准 这 个 请 求 ， 并 允许 该 进程 继续 执行 ， 否 则 ， 操 作 系统 应 当 拒绝 这 个 
请 求 ， 也 许 把 这 个 进程 归 类 为 等 待 进程 ， 直 到 打印 机 可 用 为 止 。 如 果 有 两 个 进程 同时 获得 对 打 
印 机 的 访问 权 ， 那 么 结果 对 两 者 都 是 不 可 取 的 。 

为 了 控制 对 打印 机 的 访问 ， 操 作 系统 必须 要 跟踪 打印 机 是 否 已 经 被 分 配 。 解 决 这 个 任务 的 
一 种 方法 是 使 用 一 个 标志 。 在 这 里 ， 它 指 存储 器 中 的 1 位 ， 其 状态 通常 是 指 署 位 〈set) 和 清 夫 
《clear)， 而 不 是 1 和 0。 清 零 标 志 《 值 为 0) 表示 打印 机 可 用 ， 置 位 标志 〈 值 为 1) 表示 打印 机 当 
前 已 经 分 配 出 去 了 。 表 面 上 看 ， 这 种 方法 看 起 来 似乎 可 行 。 每 次 ， 访 问 打 印 机 的 一 个 请 求 到 来 
时 ， 操 作 系统 要 做 的 工作 仅仅 是 检查 这 个 标志 位 。 如 果 是 清 零 标志 位 ， 那 么 操作 系统 就 批准 该 
请 求 ， 同 时 将 标志 位 进行 置 位 。 如 果 标 志 位 已 经 置 位 ， 操 作 系统 就 将 提出 请 求 的 进程 放 入 等 待 
队列 中 。 每 当 一 个 进程 完成 了 访问 打印 机 的 任务 ,操作 系统 要 么 将 打印 机 分 配给 一 个 等 待 进程 ， 
要 么 在 没有 等 待 进程 时 ， 将 这 个 标志 清 零 。 

然而 ， 这 个 午 单 的 标志 系统 还 是 有 个 问题 。 测 试 和 可 能 有 的 标志 置 位 任务 也 许 需 要 几 条 机 
髓 指令 。( 从 主 存 得 到 标志 ， 在 CPU 中 操纵 ， 然 后 最 终 写 回 主 存 .) 因此 ， 在 检测 到 清 零 标志 之 
后 标志 被 置 位 之 前 ， 这 个 任务 被 中 断 是 有 可 能 发 生 的 。 具 体 而 言 ， 假 设 这 个 打印 机 当前 是 可 用 
的 ， 且 一 个 进程 请 求 它 的 使 用 权 ， 标 志 从 主 存 被 找到 ， 而 且 发 现 已 清 堆 ， 表 示 该 打印 机 可 用 。 
但 是 ， 在 这 个 时 候 这 个 进程 被 中 断 了 ， 另 一 个 进程 开始 了 它 的 时 间 片 ， 它 也 请 求 打 印 机 的 使 用 
权 。 于 是 再 一 次 检测 打印 机 的 标志 ， 仍 发 现 它 是 清 零 的 。 因 为 前 一 个 进程 在 操作 系统 要 求 从 主 
存 置 位 标志 之 前 锌 中 断 了 。 因 此 ， 操 作 系统 允许 第 二 个 进程 使 用 打印 机 。 过 后 ， 第 一 个 进程 在 
它 被 中 断 的 地 方 恢复 执行 ， 那 个 地 方正 是 操作 系统 发 现 标志 是 清 零 的 地 方 。 于 是 ， 操 作 系 统 继 
续 允 许 第 一 个 进程 访问 打印 机 。 现 在 ， 这 两 个 进程 在 使 用 同一 台 打 印 机 。 

这 个 问题 的 解决 办 法 就 是 要 坚持 测试 和 可 能 有 的 标志 置 位 任务 必须 在 没有 中 断 的 条 件 下 完 
成 。 一 种 方法 是 使 用 大 多 数 机 器 语言 都 提供 的 中 断 屏 蔽 指令 和 中 断 允 许 指令 。 在 执行 时 ， 中 断 
屏蔽 指令 使 未 来 的 中 断 被 锁定 ， 而 中 断 允 许 指令 则 使 CPU 恢复 对 中 断 信号 的 响应 。 于 是 ， 如 果 
操作 系统 用 中 断 屏 项 指令 开始 一 个 标志 测试 例 程 ， 并 以 中 断 允 许 指令 结束 ， 那 么 该 例 程 一 旦 开 
始 吏 不 会 有 其 他 活动 中 断 它 。 

发 一 种 方法 是 使 用 测试 并 置 位 〈test-and-set) 指令 ， 它 在 许多 机 器 语言 里 可 用 。 这 条 指令 要 
求 CPU 检索 一 个 标志 的 值 ， 记 住 它 ， 然 后 置 位 该 标志 ， 所 有 工作 都 在 一 条 机 器 指令 内 完成 。 它 
的 优点 是 ， 因 为 CPU 在 辨认 一 个 中 断 之 前 必须 完成 当前 的 指令 ， 所 以 ， 测 试 任 务 和 标志 置 位 作 
为 一 条 指令 实现 时 不 可 能 被 分 隔 的 。 

刚才 描述 的 一 个 正确 实现 的 标志 称 为 信号 量 〈semaphore)。 它 源 自 于 控制 轨道 区 段 使 用 的 
铁路 信号 灯 。 事 实 上 ， 信 和 号 量 在 软件 系统 里 的 用 法 与 信号 灯 在 铁路 系统 里 的 用 法 是 一 样 的 。 对 
应 于 一 个 轨道 区 间 一 次 只 能 有 一 列 列 车 ， 一 段 指令 一 次 只 能 被 一 个 进程 执行 。 这 样 一 段 指令 称 
为 临界 区 《critical region)。 一 个 临界 区 一 次 只 能 允许 被 一 个 进程 执行 ， 这 个 要 求 称 为 互 斥 。 概 
插 地 说， 获得 对 一 个 临界 区 的 互 斥 的 常用 办 法 是 用 一 个 信号 量 守护 这 个 临界 区 。 一 个 进程 要 进 
这 个 临界 区 ， 必 须 确定 这 个 信号 量 是 清 零 的 ， 并 在 进入 临界 区 之 前 把 它 置 位 ， 然 后 在 出 临界 区 
时 ， 该 进程 必须 把 这 个 信和 号 量 清 零 。 如 果 发 现 这 个 信和 号 量 在 置 位 状态 ， 那 么 试图 进入 临界 区 的 
进程 必须 等 待 ， 直 到 这 个 信和 号 量 被 清 零 。 


微软 的 任务 管理 器 
通过 执行 任务 管理 器 这 个 应 用 程序 ， 你 可 以 对 微软 Windows 操 作 系 统 的 内 部 活动 获得 深 
刻 的 了 解 . ( 同时 按 下 Ctrl、Alt 和 Delete 键 . ) 特别 地 ， 通 过 选择 任务 管理 器 窗口 的 进程 tapb， 
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你 可 以 看 到 进程 表 。 在 此 ， 你 可 以 体验 一 下 : 在 激活 任何 应 用 程序 之 前 ， 看 一 下 进程 表 。( 你 
也 许 会 惊讶 于 表 中 已 经 有 如 此 多 的 进程 。 它 们 对 于 系统 的 基本 应 用 都 是 必 不 可 少 的 。) 现在 
激活 一 个 应 用 ， 并 且 确 认 另 一 个 进程 已 经 进入 到 表 中 。 你 将 还 能 够 看 到 分 配给 进程 的 存储 
空间 量 。 


3.4.2 ” 死 锁 


在 资源 分 配 中 可 能 发 生 的 另 一 个 问题 是 死 锁 〈deadlock)。 在 死 锁 状 态 下 ， 两 个 或 更 多 的 进 
程 被 阻塞 不 能 执行 ， 因 为 它们 中 的 每 一 个 都 在 等 待 己 分 配给 为 一 个 的 资源 。 例 如 ， 一 个 进程 可 
能 已 有 对 打印 机 的 访问 权 ， 同 时 它 还 在 等 竺 访问 CD 播放 机 ， 而 为 一 个 进程 有 CD 播放 机 的 访问 
权 , 却 在 等 待 访问 打印 机 。 另 一 个 例子 出 现在 允许 进 程 创建 新 的 进程 (这 种 活动 在 UNIX 术 语 中 
称 为 创建 子 进程 (forking)) 来 完成 子 任务 的 系统 里 。 如果 调度 程序 因为 进程 表 没 有 空间 而 无 法 创 
建新 的 进程 ， 同 时 系统 里 的 每 个 进程 又 都 必须 创建 额外 的 进程 才能 完成 它 的 任务 ， 那 么 没有 一 
个 进程 可 以 继续 。 这 种 条 件 下 《〈 见 图 3-7) 严重 降低 了 系统 的 性 能 。 

死 锁 状态 的 分 析 已 经 揭示 ， 上 只 有 以 下 三 个 条 件 全 部 满足 它 才 会 出 现 : 

(D) 存在 对 不 可 共享 资源 的 竞争 。 

(2) 这 些 资 源 是 在 不 完整 的 基础 上 请 求 的 。 也 了 吏 是 说 ， 一 个 进程 接受 了 茶 些 资源 后 ， 稍 后 
还 将 请 求 其 他 的 资源 。 

(G3) 一 个 资源 一 旦 被 分 配 出 去 ， 它 不 能 以 强制 的 办 法 再 收回 。 





图 3-7 ”由 于 驶 争 不 可 共享 的 铁路 区 间 造 成 的 死 锁 


分 离 出 这 些 条 件 的 意义 在 于 着 力 解决 这 三 个 条 件 当 中 的 任何 一 个 ， 承 可 以 避免 死 锁 问题 。 
一 般 认 为 ， 着 力 于 第 三 个 条 件 的 技术 属于 称 为 死 锁 检测 和 改正 方案 的 范畴 。 在 这 种 情况 下 ， 和 死 
锁 状 态 的 出 现 被 认为 不 大 容易 出 现 ， 因 而 不 必 特 别 采 取 办 法 避免 ， 而 只 是 在 死 锁 将 要 出 现 的 时 
候 检测 出 它 ， 然 后 通过 强制 性 收回 某 些 己 经 分 配 出 去 的 资源 的 办 法 来 改正 它 。 一 个 满 的 进程 表 
的 例子 属于 这 种 情况 。 在 初始 设置 一 个 计算 机 系统 时 ， 系 统管 理 员 通常 都 会 这 样 建立 进程 表 ， 
让 它 大 到 足以 满足 该 系统 的 希 要 。 然 而 ， 如 果 死 锁 是 由 于 进程 表 满 而 产生 的 ， 那 么 管理 员 只 要 
利用 他 作为 “超级 用 户 ” 的 特权 去 掉 〈 专 业 术 语 是 清除 〈kill)) 某 些 进程 。 它 将 释放 其 空间 ， 
使 得 剩 下 的 进程 可 以 继续 它们 的 工作 。 

者 力 于 解决 前 两 个 条 件 的 技术 ， 一 般 被 称 为 死 锁 避免 方案 。 例 如 ， 针 对 第 二 个 条 件 的 一 个 
方法 是 要 求 每 个 进程 一 次 性 请 求 它 所 需要 的 全 部 资源 。 另 一 个 也 许 更 具 想象 力 的 技术 是 针对 第 
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一 个 条 件 ， 它 不 是 直接 地 消除 竞争 ， 而 是 把 不 可 共享 的 资源 转变 为 可 共享 的 资源 。 例 如 ， 假 定 
出 问题 的 资源 是 打印 机 ， 各 种 进程 都 请 求 使 用 它 。 每 当 一 个 进程 请 求 打 印 机 时 ， 操 作 系统 都 批 
准 这 个 请 求 。 但 是 ， 操 作 系统 不 是 把 这 个 进程 连接 到 打印 机 的 设备 驱动 程序 上 ， 而 是 连接 到 一 
个 “ 姑 构 ”的 设备 驱动 程序 上 ， 该 驱动 程序 把 要 打印 的 信息 存放 在 海量 存储 器 上 ， 而 不 把 它们 
发 送 到 打印 机 上 。 于 是 ， 每 个 进程 都 认为 它 访 问 了 打印 机 ， 所 以 能 正常 工作 。 以 后 ， 当 打印 机 
可 用 时 ， 操 作 系统 可 以 把 数据 从 海量 存储 器 传送 到 打印 机 。 按 照 这 个 方法 ， 操 作 系 统 通过 建立 
多 个 虚构 的 打印 机 把 不 可 共享 的 资源 变 成 了 好 像 是 可 共享 的 。 这 种 保存 数据 供 以 后 在 合适 的 时 
收 答 出 的 技术 称 为 假 脱 机 〈spooling)， 它 在 各 种 规模 的 机 器 里 都 很 流行 。 

作为 一 种 允许 多 个 进程 访问 一 个 公共 资源 的 技术 ， 我 们 介绍 了 假 脱 机 一 _ 它 可 以 有 许多 
变 体 。 例如， 文件 管理 程序 可 以 批准 若干 个 进程 访问 同一 个 文件 ， 如 果 它 们 只 是 从 该 文件 读 
取 数 据 。 但 是 ， 如 果 多 于 一 个 进程 试图 同时 更 改 一 个 文件 时 就 会 发 生 冲突 。 于 是 ， 文 件 管理 
程序 可 以 根据 进程 的 需要 分 配 文件 的 访问 权限 ， 允 许 若干 个 进程 有 读 访 问 权 ， 但 在 任何 给 定 
时 刻 只 有 一 个 进程 有 写 访问 权 。 其 他 的 系统 可 能 把 这 种 文件 分 成 区 段 ， 使 得 不 同 的 进程 可 以 
并 发 地 更 改 文件 的 不 同 部 分 。 然 而 ， 每 一 项 这 种 技术 要 得 到 一 个 可 靠 的 系统 ， 都 有 一 些 枝 节 
上 的 问题 吗 待 解决 。 例 如 ， 当 有 写 访问 权 的 进程 更 改 了 这 个 文件 ， 那 么 如 何 通知 那 些 只 有 读 
访问 权 的 进程 呢 ? 


问题 与 练习 

1. 假定 进程 A 和 B 闪 享 同 台 机 器 的 时 间 , 并 且 每 个 进程 都 需要 短 时 间 使 用 同 个 不 可 共享 的 资源 〈 例 
如 ， 每 个 进程 可 能 都 打印 一 系列 独立 的 短 报 告 ) 。 每 个 进程 都 重复 地 获得 这 个 资源 ， 释 放 它 ， 稍 后 又 
再 次 请 求 它 。 按 照 下 面 的 方法 控制 对 该 资源 的 访问 存在 什么 缺点 ? 
开始 时 ， 给 一 个 标志 赋 子 值 0， 如 果 进 程 A 请 求 这 个 资源 并 且 该 标志 为 0， 那 么 就 批准 这 个 请 求 ， 否 则 
使 进程 A 处 于 等 待 状态 ; 如 果 进 程 B 请 求 这 个 资源 并 且 该 标志 为 1， 那 么 就 批准 这 个 请 求 ， 否则 使 进程 
B 处 于 等 符 状 态 。 每 当 进 程 A 完 成 对 这 个 资源 的 访问 以 后 ， 把 标志 变 为 1， 每 当 进 程 B 完 成 对 这 个 资源 
的 语 问 以 后 ， 把 标志 变 为 0， 

- 假定 一 条 双 车 道 的 道路 在 过 隧道 时 合并 为 一 个 车 道 。 为 了 协调 这 个 隧道 的 使 用 , 安装 了 下 述 信号 系统 ; 
一 辆 汽车 无 论 从 哪个 入 口 进入 隧道 ， 都 会 使 隧道 入 口 处 上 方 的 红 灯 点 亮 ， 当 这 辆 汽车 离开 隧道 时 ， 红 
灯会 灭 。 如 果 一 辆 到 达 的 汽车 发 现 红 灯 亮 时 ， 那 么 它 要 等 待 ， 直 到 红 灯 灭 时 方 可 进入 隧道 
过 个 系统 存在 什么 问题 ? 

.为 了 解决 单行 桥 上 两 辆 车 相遇 的 死 锁 问题 , 假设 已 提出 下 面 儿 个 解决 方案 。 说 明 每 个 解决 方案 各 消除 

了 前 文中 提 到 的 3 个 死 锁 条 件 中 的 哪 一 个 。 

a， 在 桥 上 变 竺 之 前 不 允许 汽车 上 桥 。 

b， 奶 果 两 车 相遇 ， 让 其 中 一 辆 车 倒退 。 

c. 桥 上 加 一 个 车 道 。 

假定 我 们 用 圆 点 表示 多 道 程序 设计 系统 中 的 每 一 个 进程 ,从 第 一 个 圆 点 到 第 一 个 圆 二 的 稍 夫 表示 第 一 

个 〈 圆 点 所 表示 的 ) 进程 等 待 〈 第 二 个 圆 点 所 表示 ) 进程 正在 使 用 的 《 非 共享 》 资源 . 数学 家 把 得 到 

的 图 称 为 有 向 图 〈directed graph) ， 有 向 图 的 什么 性 质 等 价 于 操作 系统 的 死 锁 问 题 ? 
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由 于 操作 系统 管理 着 计算 机 的 活动 ， 很 自然 ， 它 也 在 维护 安全 性 方面 起 了 重要 的 作用 。 从 
完整 意义 上 说 ， 安 全 性 自身 也 有 多 种 表现 形式 ， 可 靠 性 就 是 其 中 一 种 。 如 果 文 件 管理 程序 的 缺 
陷 使 得 一 个 文件 的 一 部 分 于 失 了 ， 那 么 这 个 文件 就 是 不 安全 的 。 如 果 一 个 操作 系统 里 的 缺陷 时 
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绎 系统 故障 〈 通 音 称 为 系统 骨 误 )， 使 得 一 小 时 有 价值 的 打字 丢失 了 ， 那 么 我 们 会 说 ， 我 们 的 工 
作 古 不 安全 的 。 因 此 ， 计 算 机 系统 的 安全 性 需要 一 个 设计 完美 的 可 信赖 的 操作 系统 。 

可 靠 性 软件 的 研发 不 再 受制 于 操作 系统 ， 它 贯穿 整个 软件 开发 过 程 。 在 计算 机 科学 里 领域 
里 称 之 为 软件 工程 ， 我 们 将 在 第 7 章 讨论 这 个 论题 。 在 本 节 ， 我 们 聚焦 讨论 与 操作 系统 息息相关 
的 安全 性 问题 。 


3.5.1 来 自 机 如 外 部 的 攻击 


操作 系统 的 一 个 重要 的 任务 就 是 ， 保 护 计 算 机 的 资源 ， 防 止 受到 非 授 权 用 户 的 访问 。 在 不 
闻 的 人 使 用 计算 机 的 时 候 ， 操 作 系统 一 般 通 过 为 不 同 的 授权 用 户 建立 “账户 ”的 方法 来 标记 不 
同 权 限 的 用 户 。 账 户 实际 上 是 包含 了 诸如 用 户 的 姓名 、 登 录 密 码 和 用 户 的 权限 等 条 目的 记录 。 
操作 系统 在 每 修 登 录 (login) 过 程 〈 登 录 过 程 是 一 系列 事务 活动 ， 在 这 个 过 程 中 ， 用 户 建立 与 
计算 机 操作 系统 的 初步 联系 ) 中 使 用 这 些 信 息 控 制 它 们 对 系统 的 访问 权限 。 

账户 由 超级 用 户 〈super user) 或 管理 员 (administrator) 创建 。 在 登录 过 程 中 通过 了 操作 系 
统 的 管理 员 身 份 验证 〈 通 常 是 通过 用 户 名 和 密码 ) 的 用 户 将 享有 很 高 的 访问 权限 。 这 种 联系 一 
旦 建立 ， 管 理 员 就 可 以 更 改 操作 系统 的 内 部 设置 ， 修 改 关 键 的 软件 包 ， 调 整 其 他 用 户 访问 系统 
的 权限 ， 进 行 各 种 各 样 一 般 用 户 不 能 进行 的 活动 。 

通过 这 种 “高 级 地 位 ”， 管 理 员 用 户 能 够 监视 计算 机 系统 的 行为 ， 检 测 到 不 管 是 恶意 还 是 偶 
然 的 破坏 行为 。 为 了 巩固 这 种 关系 ， 开 发 了 大 量 的 称 之 为 审计 软件 (auditing software) 的 软件 
实用 程序 ， 来 记录 和 分 析 发 生 在 计算 机 系统 中 的 行为 。 特 别 地 ， 审 计 软 件 可 以 确定 许多 试图 用 
错误 的 密码 登录 系统 的 活动 ， 指 示 出 非 授权 用 户 试图 获得 计算 机 访问 权 的 行为 。( 这 样 的 事情 不 
太 可 能 发 生 : 一 个 用 户 ， 以 前 仅仅 具有 文字 处 理 和 使 用 电子 表格 的 权利 ， 然 后 突然 能 够 访问 系 
统 的 高 级 技术 的 应 用 软件 或 者 试图 执行 超过 其 权限 范围 的 实用 软件 包 。 ) 

设计 审计 软件 的 另外 一 个 目的 是 为 了 检测 嗅 探 软件 〈sniffing software) 的 存在 ， 该 软件 能 
够 记录 一 个 正在 运行 的 计算 机 的 行为 ， 并 稍 后 将 之 报告 给 潜在 的 入 侵 者 。 举 一 个 老 的 但 是 很 有 
名 的 例子 ， 如 果 一 个 程序 能 够 模拟 操作 系统 的 登录 过 程 ， 那 么 这 个 程序 就 能 被 用 来 欺骗 操作 系 
统 的 授权 用 户 ， 使 他 们 认为 自己 是 在 和 操作 系统 通信 。 然 而 ， 实 际 上 他 们 是 在 和 一 个 冒名 顶替 
者 通信 ， 并 将 目 己 的 用 户 名 和 密码 提供 给 冒名 顶替 者 。 

在 所 有 与 计算 机 安全 相关 的 复杂 技术 问题 上 ， 让 很 多 人 感到 吃惊 的 是 ， 计 算 机 系统 安全 领 
域 中 的 主要 难题 之 一 就 是 用 户 自 己 的 不 小 心 。 例 如 ， 用 户 选择 的 密码 相对 比较 容易 猜 〈 如 名 字 
和 生日 等 ) 与 朋友 共享 目 己 的 密码 ; 没有 定时 更 换 自 己 的 密码 ; 将 自己 的 海量 存储 设备 在 机 器 
间 来 回 的 转移 ， 这 样 就 潜在 地 降低 了 系统 的 安全 性 ;在 计算 机 系统 中 安装 了 未 经 证 实 的 软件 ， 
从 而 有 可 能 损坏 了 系统 的 安全 性 。 对 于 上 述 问 题 ， 大 多 数 计算 机 安装 机 构 都 采用 强制 的 策略 ， 
将 用 户 的 需求 和 职责 严格 地 分 离开 来 。 


3.5.2 ”来 目 机 器 内 部 的 攻击 


一 旦 入 侵 者 《或 者 可 能 是 坏 有 亚 意 目的 的 授权 用 户 ) 获得 了 系统 的 访问 权限 ， 那 么 ， 他 们 
下 一 步 的 工作 通常 是 浏览 机 器 ， 寻 找 其 感 兴趣 的 信息 或 者 是 能 够 插入 带 有 破坏 目的 的 软件 的 地 
方 。 如 果 一 个 人 侵 者 获取 了 系统 的 管理 员 账 号 ， 那 么 上 述 过 程 的 发 生 就 很 自然 了 。 这 也 是 我 们 
为 什么 要 严格 保护 好 管理 员 密 码 的 原因 。 然 而 ， 如 果 是 通过 普通 账号 进行 访问 ， 那 么 ， 入 侵 者 
必然 会 欺骗 操作 系统 ， 人 允许 其 获得 超过 授予 该 用 户 的 权限 。 例 如 ， 入 侵 者 会 尝试 着 欺骗 内 存 管 
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理 程 序 ， 让 一 个 进程 访问 其 分 配 的 存储 区 以 外 的 内 存 区 域 ， 或 者 欺骗 文件 管理 程序 ， 访 问 本 应 
该 拒绝 访问 的 文件 。 

今天 ，CPU 在 设计 时 已 经 加 强 了 一 些 功能 特征 ， 能 够 阻止 上 面谈 到 的 攻击 尝试 。 举 一 个 例 
子 来 说 ， 我 们 可 以 考虑 这 样 一 个 需求 : 通过 内 存 管 理 程序 ， 将 进程 限制 在 内 存 给 它 分 配 的 区 域 
站。 如 果 没有 这 样 的 限制 ， 一 个 进程 就 能 够 从 内 存 中 覆盖 掉 操 作 系统 ， 从 而 接管 对 计算 机 的 欣 
制 。 考 虑 这 样 的 一 种 威胁 ， 为 多 任务 系统 设计 的 CPU 通常 包括 若干 个 专用 寄存 器 ， 操作 系统 可 
以 在 这 些 寄存 器 中 保存 分 配给 一 个 进程 的 存储 区 域 的 上 下 界 。 于 是 ， 当 执行 该 进程 时 ，CPU 押 
每 个 存储 器 引用 与 这 些 寄存 器 中 的 值 进行 比较 ， 以 保证 该 引用 在 指定 的 界限 之 内 。 如 果 发 现 这 
个 引用 在 该 进程 指定 的 区 域 之 外 ，CPU 将 自动 把 控制 权 交 还 给 操作 系统 〔 借 助 于 中 断 处 理 )， 这 
样 操 作 系统 可 以 做 出 合理 的 处 理 。 

这 个 方案 中 还 存在 一 个 小 的 但 很 重要 的 问题 。 如 果 没 有 进一步 的 安全 措施 ，-- 个 进程 还 是 
能 够 访问 指定 区 域 以 外 的 内 存单 元 ， 只 要 改变 含有 存储 器 界限 的 专用 寄存 器 的 值 即 可 。 也 就 是 
说 ， 一 个 进程 想 要 访问 更 多 的 内 存 区 域 ， 它 只 需要 增加 存放 上 界 的 寄存 器 的 值 ， 然 后 不 需要 得 
刘 井 作 系 统 的 批准 ， 就 可 以 使 用 这 些 额外 的 内 存 区 域 。 

为 了 防止 这 种 恶意 的 活动 ,将 多 任务 处 理 的 CPU 设计 为 工作 在 两 种 特权 级 (privilege level) 
之 一 的 模式 下 。 我 们 将 其 中 之 一 称 为 “有 特权 模式 ” 而 另外 一 个 称 为 “无 特权 模式 ”。 当 处 
企 有 特权 模式 下 时 ，CPU 了 能够 用 自己 的 机 器 语言 处 理 所 有 的 指令 ， 然 而 ， 当 处 在 无 特权 模式 
下 时 ， 能 够 接受 的 指令 就 是 有 限 的 。 这 种 仅 能 够 在 有 特权 模式 下 可 用 的 指令 ， 我 们 称 为 特权 
指令 (privileged instruction)。( 典 型 的 有 特权 指令 例子 包括 改变 内 存 界限 寄存 器 的 内 容 的 指令 
和 改变 CPU 当前 的 有 特权 模式 的 指令 等 。) 当 CPU 处 于 无 特权 模式 时 ， 任 何 执行 特权 指令 的 企 
图 都 将 引起 中 断 。 这 个 中 断 将 CPU 转变 为 有 特权 模式 ， 并 将 控制 权 交 给 操作 系统 内 部 的 中 断 
处 理 程序 。 

当 开 机 时 ，CPU 处 于 有 特权 模式 ， 这 样 ， 操 作 系统 在 引导 过 程 后 开始 启动 时 ， 所 有 的 指令 
部 可 以 执行 。 然 而 ， 每 当 操作 系统 允许 一 个 进程 开始 执行 它 的 时 间 片 时 ， 就 通过 执行 “改变 特 
权 杞 式 ”的 指令 ， 将 CPU 切换 到 无 特权 模式 。 于 是 ， 如 果 一 个 进程 试图 执行 有 特权 指令 ， 操 作 
系统 就 会 得 到 通知 ， 这 样 ， 操 作 系统 就 充当 了 维护 计算 机 系统 完整 性 的 角色 ， 

有 特权 指令 和 控制 特权 级 别 是 操作 系统 维护 安全 性 可 用 的 一 个 主要 工具 。 然 而 ， 使 用 这 些 
工具 ， 对 操作 系统 设计 而 言 ， 是 一 项 复杂 的 任务 。 在 当前 的 操作 系统 中 ， 错 误 还 不 断 在 出 现 。 
四 此 ， 在 特权 级 别 控制 中 ， 任 何 一 点 疏忽 都 可 能 给 灾难 打开 大 门 ， 不 论 是 恶意 程序 引起 的 ， 还 
古 无 意 中 的 程序 设计 错误 造成 的 。 如 果 人 允许 一 个 进程 更 改 控制 分 时 系统 的 计时 器 ， 那 么 这 个 进 
程 能 够 延长 它 自己 的 时 间 片 ， 甚 至 控制 整个 机 器 。 如 果 允 许 一 个 进程 直接 访问 外 围 设 备 ， 那 么 
已 厌 能 不 受 系统 文件 管理 程序 的 监管 而 读 取 文件 。 如 果 允 许 一 个 进程 访问 分 配给 它 的 区 域 之 外 
的 户 存 单元 ， 那 么 它 就 能 访问 甚至 更 改 由 其 他 进程 正在 使 用 的 数据 。 因 此 ， 维 护 计算 机 的 安全 
人 性， 既是 管理 员 的 一 个 重要 的 任务 ， 也 是 操作 系统 设计 的 一 个 目标 。 


问题 与 练习 

-列举 几 个 密码 选取 不 好 的 例子 ， 并 说 明 为 什么 不 好 。 

2. 英特尔 奔腾 系列 处 理 器 提供 4 个 特权 级 别 ， 入 什么 CUP 的 设计 人 员 选 择 4 个 ， 而 不 是 3 个 或 5 个 ?9 

如 朱 分 时 系统 里 的 一 个 进程 可 以 访问 分 配给 它 的 区 域 之 外 的 存储 单元 ,那么 它 怎 样 获得 该 机 器 的 拉 汕 
权 ? 
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列 出 一 个 典型 的 操作 系统 的 4 项 工作 。 

概述 批 处 理 和 交互 式 处 理 的 区 列 。 
假设 有 3 个 作业 R、S、T， 按 这 个 顺序 排 在 一 
个 作业 队列 里 ， 接 着 ， 在 第 4 个 作业 X 进 入 队 
列 之 前 , 2 个 作业 移出 了 队列 ,然后 又 有 2 个 作 
业 移 出 了 队列 ， 作 业 Y 和 作业 2Z 排 进 队 列 ， 节 
后 , 按照 一 次 一 个 作业 地 顺序 移出 ,使 队列 变 
空 。 请 技 移出 的 顺序 列 出 所 有 的 作业 。 


. 变 互 式 处 理 和 实时 处 理 的 差别 是 什么 ? 
. 什么 是 多 任务 操作 系统 ? 
. 如 果 你 有 一 台 PC， 列 举 它 的 几 个 多 任务 功能 


给 你 带 来 方便 的 情形 。 


. 根据 你 所 熟悉 的 计算 机 系统 , 列举 两 小 应 用 软 


件 组 件 和 两 个 实用 软件 组 件 , 然后 说 明 你 为 什 


. a， 操作 系统 的 外 壳 的 作用 是 什么 ? 


b. 操作 系统 的 内 核 的 作用 是 什么 ? 
路 径 XAY/7Z 描 述 的 是 什么 目录 结构 ? 


. 定义 操作 系统 环境 下 使 用 的 术语 “ 进 往 ”。 

. 操作 系统 的 进程 表 里 包含 什么 信息 ? 

. 就 绪 进 程 和 等 待 进程 的 差别 是 什么 ? 

. 虚拟 存储 器 和 主 存储 器 之 间 的 差别 是 什么 ? 

. 假设 某 计 算 机 有 512 MB 的 主 存 ， 操 作 系统 要 


创建 主 存 两 倍 大 小 的 页 式 虚 拟 和 内存 , 页 面 大 小 
为 2KB， 请 问 需要 多 少 页 ? 


. 在 分 时 /多 任务 系统 里 ， 如 果 两 个 进程 同时 访 


问 同一 个 文件 ,会 发 生 怎样 泡 乱 的 情况 ? 征 右 
存在 文件 管理 程序 批准 这 种 请 求 的 情形 ? 是 
否 存 在 文件 管理 程序 拒绝 这 种 请 求 的 情形 ? 


. 应 用 软件 和 系统 软件 之 间 的 区 别 是 什么 ? 请 


各 举 一 个 例子 。 


. 定义 多 处 理 器 体系 结构 情况 下 的 负载 平衡 与 


击 分 。 


, 概述 引导 过 程 。 
, 为 什么 说 引导 过 程 是 必要 的 ? 
. 如 果 你 有 一 台 PC， 记 录 开 机 时 你 所 观察 到 的 


活动 序列 。 然 后 确定 在 引导 进程 实际 开始 工作 
之 前 显示 在 计算 机 屏幕 上 有 哪些 信息 ? 什么 
软件 写 下 这 些 信息 ? 


. 假定 多 道 程 序 设计 操作 系统 分 配 的 时 间 睫 是 


20 毫 秒 ， 计 算 机 每 微 种 平均 执行 5 条 指令 ， 那 
在 一 个 时 间 片 内 能 执行 多 少 条 指令 ? 
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如 果 一 个 打字 员 每 分 钟 能 打 60 个 单词 (在 这 里 
假设 一 个 单词 售 5 个 字符 ) ， 问 每 打 一 个 字符 
要 多 和 久 ? 如 果 多 道 程序 设计 系统 分 配 的 时 间 
片 为 20 ms， 我 们 忽略 进程 间 切 换 的 时 间 ， 问 
打 一 个 字符 要 分 配 多 少时 间 片 ? 

假定 一 个 多 道 程序 设计 系统 分 配 时 间 上 户 为 $0 
ms， 如 果 把 磁盘 的 读 写 头 定 位 到 所 希望 的 道 
上 通常 要 花费 8 ms, 并 且 道 上 所 要 的 数据 旋转 
到 读 写 头 之 下 通常 要 17 ms， 那 么 等 待 一 个 读 
磁盘 操作 发 生 可 能 要 多 少 个 时 间 片 ? 如 果 该 
机 器 每 微 秒 能 执行 10 条 指令 , 那么 在 这 个 等 街 
时 间 里 可 以 执行 多 少 条 指令 ? (这 就 是 为 什 
么 ， 当 一 个 进程 用 外 围 设 备 完 成 操作 时 ， 多 道 
程序 设计 系统 终止 这 个 进程 的 时 间 片 ,让 另 一 
个 进程 运行 而 让 第 一 个 进程 等 待 外 围 设 备 的 
服务 。) 


. 列举 一 个 多 任务 操作 系统 必须 协调 访问 的 5 种 


资源 。 

一 个 进程 如 果 它 需要 执行 大 量 的 O 运 算 则 称 
为 受 IO 限 制 的 ， 而 另 一 个 进程 如 果 由 大 多 数 
在 CPU/ 内 存 中 完成 的 运算 构成 则 称 为 受 运算 
限制 的 。 如 果 这 两 个 进程 都 在 等 待 分 配 时 间 
片 ， 请 问 如 何 确定 它们 的 优先 级 ? 为 什么 ? 
在 多 道 程 序 设计 系统 里 运行 两 个 进程 , 如 全 它 
们 两 个 都 是 UO 受 限 的 ， 或 者 一 个 是 IO 受 限 发 
-个 是 运算 受 限 的 《如 上 题 所 述 ) ， 那 么 它们 
是 否 能 达到 较 大 香 吐 量 ? 

编写 一 组 指示 告诉 操作 系统 的 分 派 程序 , 在 一 
个 时 间 片 用 完 时 该 做 什么 ? 

在 进程 状态 中 包含 什么 信息 ? 

列 出 多 道 程 序 设计 系统 中 一 个 进程 没有 全 部 
用 完 分 配给 它 的 时 间 片 的 情况 。 

按照 时 间 顺 序列 出 一 个 进程 被 中 断 时 发 生 的 
主要 事件 。 


. 按照 你 所 使 用 的 操作 系统 回答 下 列 问 题 。 


a_ 如 何 请 求 操 作 系 统 把 一 个 文件 从 一 个 地 方 
复制 到 另 一 个 地 方 ? 

b. 如 何 请 求 操作 系统 显示 人 碘 盘 上 的 目录 ? 

c， 如 何 请 求 操作 系统 执行 一 个 程序 ? 

按照 你 所 使 用 的 操作 系统 回答 下 列 问题 。 

a. 操作 系统 如 何 限制 对 已 经 批准 给 其 他 用 户 
的 资源 的 访问 ? 
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b、 如 何 让 操作 系统 显示 当前 在 进程 表 里 的 进程 ? 
c. 如 何 告诉 操作 系统 你 不 想 该 机 器 的 其 他 用 
户 访问 你 的 文件 ? 
解释 许多 机 器 语言 里 “测试 - 置 位 ”指令 的 重 
要 用 法 。 为 什么 整个 测试 - 置 位 过 程 作为 单个 
指令 实现 是 重要 的 ? 
一 个 银行 家 只 有 100 000 美 元 ， 贷 款 给 两 个 客 
户 ， 每 位 50 000 美 元 。 后 来 这 两 位 客户 回 了 同 
伴 的 话 : 他 们 在 能 够 还 贷 之 前 各 自 还 需 10 000 
美元 ， 以 完成 与 先前 贷款 有 关 的 商业 交易 。 这 
个 银行 家 通过 从 其 他 地 方 借 来 资金 来 追加 给 
这 两 个 客户 的 贷款 (提高 贷款 利率 ) 解 次 了 这 
个 死 锁 问 题 。 在 死 锁 的 三 个 条 件 中 , 银行 家 消 
除了 其 中 的 哪个 条 件 ? 
每 个 想 参 加 本 地 大 学 的 铁路 修建 模型 T 课程 
的 学 生 , 都 要 得 到 教师 的 允许 ,并 且 交 纳 实验 
响 。 这 两 个 要 求 可 以 在 校园 的 不 同 地 点 办 理 ， 
可 以 接 早 顺序 独立 完成 。 注 册 学 生 限 制 为 20 
名 ; 这 个 限制 由 教师 和 财务 处 一 起 掌握 , 前 者 
只 允许 20 个 学 生 ， 后 者 只 收 20 个 学 生 的 费用 。 
假定 这 个 注册 系统 结果 有 19 个 学 生成 功 注册 
了 这 个 课程 ,但 是 最 后 这 个 名 额 有 两 个 学 生 竞 
委 一 一 一 个 得 到 了 老师 的 允许 , 另 一 个 交纳 了 
费用 。 下 面 解 决 该 问题 的 各 个 方案 中 , 分 别 消 
除了 死 锁 的 3 个 条 件 中 的 哪个 ? 
a， 同 意 这 两 个 学 生 都 参加 该 课程 。 
b， 了 该 班 人 数 降 为 18 人 ， 因 此 这 两 个 学 生 都 不 
能 注册 该 课程 。 
c. 拒绝 这 两 个 竞争 的 学 生 ， 让 第 三 个 学 生 作 
为 第 20 名 。 
d 注册 该 课程 的 要 求 改 为 一 个 ， 交 纳 费用 。 于 
是 交 了 费用 的 学 生 注册 成 功 , 另 一 个 被 拒绝 , 
由 于 计算 机 显示 屏 每 块 区 域 一 次 只 能 被 一 个 
进程 使 用 【〔 和 否则 屏幕 中 的 图 像 将 难以 认 清 ) ， 
这 上 综 由 窗口 管理 程序 分 配 的 区 域 是 不 可 共享 
的 。 为 了 避免 死 锁 ， 窗 口 管 理 程序 消除 了 死 锁 
的 3 个 必要 条 件 中 的 哪 一 个 ? 
假设 一 个 计算 机 系统 里 不 可 共享 资源 分 为 三 
类 : 1 层 ，2 层 ，3 层 。 其 次 ， 假 设 系 统 中 的 每 
一 个 进程 都 要 求 根据 这 个 类 别 请 求 它 所 需要 
的 资源 。 也 就 是 说 ， 它 请 求 2 层 资源 之 前 一 次 
请 求 所 有 的 1 层 资源 。 一 旦 它 得 到 了 1 层 资 源 ， 
豆 可 以 申请 所 有 的 2 层 资源 ， 依 此 类 推 ， 这 个 
系统 会 出 现 死 锁 吗 ? 为 什么 ? 
机 器 人 的 两 个 手臂 是 程序 控制 的 , 它们 从 传送 
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市 上 蔡 起 零 部 件 , 测试 它们 的 公差 并 根据 结果 
分 别 把 它们 放 到 两 个 箱子 中 。 零 部 件 一 次 到 达 
一 个 ,它们 之 间 有 足够 的 距离 。 为 了 防止 两 个 
手臂 蔡 试 抓 同一 个 零 部 件 , 控制 手臂 的 计算 机 
共享 一 个 公共 的 存储 单元 。 如 果 一 个 手臂 在 靠 
近 一 个 零 部 件 时 是 可 用 的 , 那么 控制 它 的 计算 
机 就 读 公 共 单 元 的 值 。 如 果 该 值 非 0， 那 么 手 
臂 让 那个 零 部 件 通过 ,否则 , 控制 计算 机 把 一 
个 非 0 的 值 放 到 这 个 存储 单元 ， 指 挥 那个 手臂 
抓 起 该 零件 ， 动 作 完 成 后 把 值 0 存 入 该 存储 单 
元 。 什 么 样 的 事件 序列 可 能 导致 两 个 手臂 之 间 
激烈 争夺 ? 


- 说 明 队 列 在 假 脱 机 输出 到 打印 机 的 过 程 中 的 


使 用 。 

一 个 等 待 时 间 片 的 进程 如 果 一 直 都 没 获 得 时 

间 片 ， 这 称 为 饥 饭 〈starvation) 。 

a. 对 于 亚 相 通过 十 字 路 口 的 汽车 来 说 ， 十 字 
路 口 的 地 面 是 不 可 共享 的 资源 。 控 制 这 个 
资源 分 配 的 是 红绿灯 ， 不 是 操作 系统 。 如 
果 这 个 灯 能 够 感知 每 个 方向 的 交通 流量 ， 
并 通过 程序 给 较 大 流量 的 方向 以 绿灯 ， 流 
基 少 的 方向 就 得 等 待 一 一 饥饿 。 请 问 “ 饥 
饿 ”现象 怎么 避免 ? 

. 在 一 个 进程 优先 级 保持 固定 的 优先 级 系统 
中 ， 如 果 调 度 程序 总 是 按 优 先 级 分 配 时 间 
片 ， 那 么 在 什么 时 候 一 个 进程 会 感到 “ 饥 
饿 ”? 【提示 : 相对 于 正在 等 待 的 进程 来 
说 ， 刚 执行 完 时 间 片 的 进程 的 优先 级 是 多 
少 ， 并 且 接 下 来 按 哪 种 规则 分 配 下 一 个 时 
加 上 用? ) 很 多 操作 系统 是 怎么 避免 这 个 问 
题 的 ， 你 能 猜 到 吗 ? 


二 


. 多 锁 和 饥 俄 〔 参 见习 题 40) 的 相似 之 处 是 什 


么 ? 兰 别 又 是 什么 ? 

下 和 甸 是 “哲学 家 进餐 ”问题 ， 它 最 初 是 由 狄 杰 

斯 特 拉 提 出 的 , 现在 已 经 是 计算 机 科学 民俗 的 
5 个 哲学 家 围 着 一 个 圆桌 就 座 . 每 个 人 面 

前 放 一 盘 细 面条 。 桌 上 有 5 把 叉子 ， 兹 个 盘 之 

间 有 一 把 ,每 个 哲学 家 都 在 思考 和 吃 面 之 间 轮 

换 . 为 了 吃 面 ， 一 个 哲学 家 需要 拥有 紧 挨 他 盘 

子 的 2 把 又 子 。 

说 明 “哲学 家 进餐 问题 ”中 的 死 锁 和 饥饿 〈 参 

见习 题 40) 问题 。 

一 个 分 时 系统 中 的 时 间 片 ， 如 果 使 其 越 来 越 

短 ， 那 么 会 发 生 什 么 情况 ? 越 来 越 长 呢 ? 
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*+44. 随 着 计算 机 科学 的 发 展 , 机 器 语言 已 被 扩展 以 符 ) 的 字符 组 成 。 如 果 测 试 每 个 可 能 的 口令 希 
提供 专门 指令 。 在 3.4 节 中 介绍 了 这 样 3 条 在 操 要 1hs， 那 么 测试 所 有 可 能 的 口令 需要 多 长 时 
作 系 统 中 广泛 使 用 的 指令 。 这 些 指令 是 什么 ? 间 ? 

45. 列举 两 个 操作 系统 管理 员 能 执行 厕 一般 用 户 48. 为 什么 为 多 处 理 器 系统 设计 的 各 个 CPU 能 够 
不 能 执行 的 活动 。 在 不 同 特权 级 运行 ? 

46. 操作 系统 如 何 防止 一 个 进程 访问 另 一 个 进程 49. 列 出 两 个 由 有 特权 的 指令 请 求 的 典型 事件 ? 
的 存储 空间 ? 50. 列 池 一 个 进程 可 能 挑战 计算 机 系统 (如 果 未 钙 

47. 假定 一 个 口令 由 9 个 取 上 自 英 文字 母 表 (26 个 字 操作 系统 保护 ) 安全 性 的 3 种 方式 。 

社会 问题 


下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 这 些 问 题 不 
是 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回 答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 


1. 假定 你 在 使 用 一 个 多 用 户 操作 系统 ， 如 果 别 的 用 户 的 文件 没有 其 他 保护 措施 ， 它 不 但 允 
许 你 查看 文件 的 名 字 ， 而 且 允 许 查看 那些 文件 的 内 容 。 未 经 允许 就 查看 这 些 信 息 类 似 于 
未 经 允许 就 闲 诞 别人 未 锁 门 的 房间 ， 还 是 类 似 于 阅读 放 在 公共 休息 室 (如 医生 的 候诊 室 ) 
的 资料 ? 

2. 你 访问 一 个 多 用 户 计 算 机 系统 ， 在 选择 你 的 口令 时 有 什么 责任 ? 

3. 如 果 一 个 操作 系统 的 安全 性 里 一 个 缺陷 使 得 一 个 恶意 的 程序 员 获 得 了 对 敏感 数据 的 访 
间 ， 那 么 该 操作 系统 的 开发 人 员 应 该 负 多 大 的 责任 ? 

4. 锁 好 门 不 让 入 侵 者 入 内 是 你 的 责任 ， 还 是 除非 邀请 否则 待 在 门 外 是 公众 的 责任 ? 防备 别 
人 对 计算 机 及 其 内 容 的 访问 是 操作 系统 的 责任 ， 还 是 不 理会 这 人 台 机 器 是 黑客 的 责任 ? 

5. 在 《瓦尔 登 湖 》 一 书 中 ， 梭 罗 坚 持 认 为 ， 我 们 已 经 变 成 自己 工具 的 工具 。 也 就 是 说 ， 我 
们 并 非 从 万 拥有 的 工具 中 受益 ， 而 是 要 花费 时 间 得 到 工具 和 维护 工具 。 至 于 计算 ， 这 多 
大 程度 上 是 真 的 ? 如 果 你 有 一 台 个 人 计算 机 ， 那 么 你 花 多 少时 间 去 赚钱 承担 它 的 费用 ， 
去 学 习 如 何 使 用 它 的 操作 系统 ， 去 学 习 如 何 使 用 它 的 实用 程序 和 应 用 软件 ， 以 及 去 为 它 
的 软件 下 载 更 新 包 ? 你 得 到 的 好 处 与 你 花费 的 时 间 总 量 相 比 又 如 何 ? 当 你 使 用 它 时 ， 值 
得 花费 你 的 时 间 玛 ? 有 或 没有 个 人 计算 机 会 对 你 的 人 际 交 往 有 影响 吗 ? 
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组 网 及 因特网 


1 的 领域 ， 包 括 学 习 如 何 将 计算 机 连接 起 来 共享 信息 和 
资源 。 学 习 的 内 容 包括 网 络 的 结构 与 操作 、 网 络 的 应 用 以 及 网 络 安全 问题 。 学 习 的 
一 个 重点 主题 是 遍布 世界 范围 的 特殊 网 络 一 -因特网 。 

人们 对 个 同 计算 机 之 间 共 享 信息 和 资源 的 需求 产生 了 相互 连接 的 计算 机 系统 ， 它 被 称 为 网 
结 (network)。 计 算 机 通过 网 络 连接 在 一 起 ， 数据 可 以 从 一 台 计 算 机 传输 到 另 一 台 计 算 机 。 在 
网 络 中 ， 计 算 机 用 户 可 以 相互 交换 信息 ， 并 且 可 以 共享 分 布 在 整个 网 络 系统 中 的 资源 ， 如 打印 
功能 、 软 件 包 以 及 数据 存储 设备 。 用 于 支持 这 类 应 用 的 基础 软件 也 已 经 从 单一 的 实用 软件 包 升 
级 为 扩展 网 络 软件 系统 ， 从 而 可 以 提供 一 个 复杂 的 网 络 范围 的 基础 架构 ， 从 某 种 意义 上 说 ， 网 
络 软件 正 发 展 成 为 网 络 范围 的 操作 系统 。 本 章 将 探讨 计算 机 科学 中 这 个 不 断 发 展 的 领域 。 
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我 们 通过 介绍 多 种 基本 的 网 络 概念 开始 学 习 网 络 。 


4.1.1 网 络 分 类 


计算 机 网 络 通常 分 为 局 域 网 (Local Area Network, LAN)、 城 域 网 (Metropolitan Area Network， 
MAN) 和 广域网 (Wide Area Network，WAN )。 局 域 网 通常 由 一 幢 建 筑 物 或 者 综合 建筑 楼 群 中 
的 若 干 计算 机 组 成 。 例 如 ， 大 学 校园 的 计算 机 或 者 工厂 中 的 计算 机 都 可 以 用 局 域 网 连接 。 城 域 
网 属于 中 型 网 络 ， 例 如 可 以 覆盖 某 一 社区 。 广 域 网 连接 的 计算 机 杜 盖 范围 更 广 可 以 是 相 邻 
的 城市 ， 也 可 以 是 在 世界 的 另 一 端 。 

网 络 分 类 的 另 一 种 方式 是 根据 网 络 的 内 部 运行 是 否 基于 这 样 的 事实 ， 征 按 公 共 领 域 的 方法 
设计 的 ， 还 是 基于 特定 实体 〔 如 个 人 或 公司 ) 所 拥有 并 掌握 的 创新 方法 。 前 一 种 类 型 的 网 络 称 
为 开放 式 (open) 网 络 ， 后 者 称 为 封闭 式 〈closed) 网 络 ， 有 时 也 称 为 专用 (proprietary) 网 络 。 
开放 式 网 络 允 许 自由 通信 ， 因 此 更 容易 被 大 众 所 接 受 ， 这 就 是 它们 最 终 战 胜 专 有 网 络 的 地 方 ， 
专 有 网 络 的 应 用 受到 了 许可 费 和 合约 条 件 的 限制 。 

外 特 网 (下面 会 学 到 一 种 很 流行 的 世界 范围 的 网 络 的 网 络 ) 属于 开放 式 系统 。 尤 其 是 ， 贯 
穿 因特网 的 通信 是 由 一 组 称 为 TCP/P 协 议 艇 的 开放 标准 来 控制 的 〔 见 4.4 节 )。 任何 人 都 可 以 自 
由 地 使 用 这 些 标准 ， 而 不 需要 付费 或 是 签署 许可 协定 。 相 反 ， 像 Novell 这 样 的 公司 可 能 开发 一 
蔡 存 在 所 有 权 的 系统 ， 并 通过 出 售 及 租用 它们 而 获 利 。 

对 网 络 进行 分 类 的 另 一 种 方法 是 根据 网 络 拓扑 进行 的 ， 网 络 拓扑 是 指 计算 机 的 连接 模式 。 
亦 多 拓扑 中 ， 比 较 常 见 的 两 种 类 型 是 : 总 线 型 拓扑 ， 纯 所 有 计算 机 都 通过 同一 条 被 称 为 “总 线 ” 
的 通信 线路 连接 起 来 (如 图 4-1a)， 星 型 拓扑 ， 即 将 一 台 计 算 机 作为 中 心 ， 所 有 其 他 计算 机 都 与 
之 相连 〈 如 图 4-1 b)。20 世 纪 90 年 代 ， 冲 线 型 拓扑 得 以 流行 ， 当时 是 通过 被 称 为 以 太 网 的 一 组 标 
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准 进 行 实 施 的 ， 而 且 以 太 网 依然 是 目前 使 用 最 广泛 的 组 网 系统 之 一 。 星 型 拓扑 可 以 追溯 到 20 世 
纪 70 年 代 ， 它 是 由 一 部 服务 于 多 个 用 户 的 大 型 中 央 计 算 机 的 模式 发 展 而 来 的 。 随 着 用 户 使 用 的 
简单 终端 计算 机 发 展 成 为 小 型 计算 机 ， 星 型 拓扑 应 运 而 生 。 目 前 ， 星 型 拓扑 配置 在 无 线 网 络 中 
应 用 比较 广泛 ， 无 线 网 络 利用 无 线 电 广播 和 中 央 计 算 机 实现 通信 ， 中 央 计 算 机 被 称 为 接 入 点 
(Access Point，AP)， 作 为 协调 所 有 通信 的 焦点 。 


a_ 总 线 型 拓扑 b. 星 型 拓扑 





图 4-1 ”两 种 常见 的 网 络 拓扑 结构 


总 线 型 网 络 和 星 型 网 络 在 计算 机 的 物理 排列 上 的 区 别 并 非 总 是 很 明显 。 二 者 的 区 别 在 于 网 
络 中 的 计算 机 是 通过 一 条 公共 总 线 直 接 互相 通信 ， 还 是 通过 中 央 计 算 机 媒介 间接 通信 。 例 如 ， 
总 线 网 络 可 能 不 会 出 现 一 条 长 总 线 ， 而 与 计算 机 的 连 线 却 很 得 ， 如 图 4-1 所 示 。 相 反 ， 总 线 网 络 
会 拥有 一 条 非常 短 的 总 线 ， 而 与 每 台 计 算 机 的 连 线 却 很 长 ， 这 意味 着 总 线 网 络 看 起 来 会 比较 像 
星 型 网 络 。 确 实 ， 有 时 需要 将 每 台 计 算 机 与 中 央 位 置 通过 网 线 连 接 ， 而 在 中 央 位 置 又 把 它们 连 
接 到 一 种 叫做 集线器 (hub) 的 设备 ， 从 而 构成 总 线 网 络 。 集 线 器 其 实 就 是 一 条 非常 短 的 总 线 ， 
其 功能 在 于 将 接收 到 的 任何 信号 〈 可 能 会 经 过 一 些 放大 ) 传 回 给 与 之 相连 的 所 有 计算 机 。 尽 管 
操作 上 像 总 线 型 网 络 ， 其 结果 却 是 一 个 看 起 来 像 星 型 网 络 的 网 络 。 153 


4.1.2 协议 


为 了 网 络 运行 可 靠 ， 必 须 建立 管理 网 络 活动 的 规则 。 这 类 规则 称 为 协议 〈protocol)。 通 过 
开发 及 采纳 协议 标准 ， 商 家 生产 的 网 络 产品 则 可 以 与 其 他 商家 的 产品 兼容 。 因 此 ， 在 网 络 技术 
的 开发 中 ， 协 议 标准 的 开发 是 一 个 必 不 可 少 的 环节 。 

作为 一 个 了 解 协 议 概 念 的 例子 ， 我 们 考虑 这 样 一 个 问题 :如何 协调 网 络 中 计算 机 之 间 报 文 
的 传输 。 如 果 没 有 控制 此 类 通信 的 规则 ， 所 有 的 计算 机 就 很 可 能 同时 都 坚持 要 传输 报 文 ， 亦 或 
者 由 于 需要 协助 而 无 法 转播 报 文 。 

在 基于 以 太 网 标准 的 总 线 型 网 络 中 ， 报 文 传输 的 许可 是 通过 名 为 带 冲 突 检 测 的 载波 侦 听 多 
路 访问 〈Carrier Sense，Mnulti-Access with Collision Detection，CSMA/CD) 的 网 络 协议 进 行 控制 
的 。 该 网 络 协议 规定 每 条 报 文 都 要 广播 给 总 线 上 的 所 有 计算 机 《如 图 4-2 所 示 )。 每 台 计 算 机 都 
对 所 有 报 文 进行 监听 ， 但 是 只 关注 发 送 给 自己 的 报 文 。 为 了 传输 报 文 ， 计 算 机 需要 等 到 总 线 处 
于 空 采 状态 ， 此 时 它 开 始 传输 报 文 并 同时 监听 总 线 。 如 果 另 一 台 计 算 机 也 开始 传输 报 文 ， 那 么 
两 台 计 算 机 都 会 检测 到 这 种 冲突 ， 并 各 自 暂停 一 段 随机 长 的 时 间 后 ， 再 次 党 试 传输 。 这 种 结果 
就 像 一 小 组 人 在 交谈 中 使 用 的 次 序 一 样 。 如 果 两 个 人 同时 开始 讲话 ， 他 们 两 个 都 会 停 下 来 。 不 
回 的 是 人 们 可 能 会 有 一 系列 对 话 ， 如 “对 不 起 ， 刚 才 你 想 说 什么 ? ”“* 不 ， 不 ， 你 先 说 风 但 是 
在 CSMA/VCD 网 络 协议 下 ， 每 台 计 算 机 都 只 会 稍 候 再 作 尝试 。 

注意 ，CSMAVCD 和 无 线 星 型 网 络 并 不 兼容 。 在 无 线 星 型 网 络 中 ,所 有 的 计算 机 都 通过 中 由 
接 入 点 通信 ， 原 因 在 于 一 台 计 算 机 可 能 无 法 检测 到 与 其 他 计算 机 的 传输 冲突 。 例 如 ， 一 台 计 算 
机 可 能 监听 不 到 其 他 计算 机 ， 因 为 自己 的 信号 淹没 了 其 他 计算 机 的 信号 。 另 一 个 原因 可 能 是 不 
间 计 算 机 传输 的 信号 由 于 障碍 物 或 者 距离 的 原因 互相 阻塞 , 虽然 它们 都 能 与 中 央 接 入 点 通信 (这 
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种 情况 被 称 为 隐藏 终端 问题 (hidden terminal problem )， 如 图 4-3 所 示 )。 这 使 得 无 线 网 络 采用 避 
免 传 输 冲突 的 方法 ， 而 不 是 检测 冲突 的 方法 。 这 种 方法 被 归 类 为 带 冲 突 避 免 的 载波 侦 听 多 路 访 
问 《Carrier Sense, Multiple Access with Collision Avoidance, CSMA/CA )， 其 中 很 多 方法 是 由 IEEE 
(参见 7.1 节 ) 在 IEEE 802.11 中 定义 的 协议 下 进行 标准 化 的 ， 通 剃 被 称 为 无 线 保 真 (WiFi)。 需 要 
强调 的 是 ， 冲 突 避 免 协议 的 设计 目的 是 避免 冲突 ， 也 许 并 不 能 完全 消除 冲突 。 当 冲突 发 生 时 ， 
必须 重新 传输 消息 。 


计算 机 计算 机 计算 机 


| 人 ee 
四 
计算 机 计算 机 


图 4-2 总 线 网 络 的 通信 
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尽管 每 个 终端 系 
统 都 可 以 与 接 人 入 
点 进行 通信 ， 但 
它们 都 无 法 互相 
临 听 到 
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图 4-3 ”隐藏 终端 问题 
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全 于， 其 中 的 计算 机 由 称 为 以 太 的 同 轴 电 绕 连 接 。 以 太 网 在 20 世 纪 70 年 代 开 始 开发 ， 现 在 已 
经 由 IEEE 标 准 化 , 成 为 IEEE 802 标 准 体系 的 一 部 分 . 以 太 网 息 个 人 计算 机 组 圆 的 最 通用 方法 . 
的 确 ， 用 于 PC 的 以 太 网 卡 很 容 力 得 到 和 安装 。 

事实 上 ， 今 天 有 很 多 版 本 的 以 太 网 ， 反 上 映 了 技术 的 进步 以 及 更 高 的 传输 速率 .然而 名 
种 版 本 都 具有 以 太 家 族 的 公共 特性 ， 其 中 自持 : 将 传输 用 的 数据 组 装 的 格式 ， 实 际 传输 的 二 
进 制 位 曼彻斯特 编码 (表示 0 和 1 的 一 种 方法 ， 0 表示 为 向 下 跳 变 的 信号 ，1 表 示 为 向 上 跳 变 的 
信号 ) 的 使 用 ， 以 及 使 用 CSMAVCD 控 制 传输 的 权限 ， 
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冲突 避免 最 常见 的 方法 是 将 优先 权 赋 予 已 经 在 等 待 传输 机 会 的 计算 机 。 这 种 协议 和 以 太 网 
的 CSMA/CD 有 相似 之 处 。 二 者 的 主要 区 别 在 于 当 一 台 计 算 机 首先 需要 传输 报 文 ， 并 日 发 现 信道 
处 于 空闲 状态 时 ， 它 并 不 是 立即 开始 传输 。 相 反 ， 它 会 等 待 短暂 的 时 间 ， 只 有 当 信 道 在 这 一 段 
时 间 户 都 保持 在 空闲 状态 时 才 会 开始 传输 。 如 果 在 这 个 过 程 中 ， 信 道 被 占用 ， 那 么 计算 机 就 会 「55 
等 待 一 段 时 间 ， 时 间 的 长 度 随机 决定 ， 然 后 再 重新 尝试 传输 。 一 旦 这 段 时 间 耗 尽 ， 计 算 机 就 被 
允许 立即 占用 空闲 的 信道 。 这 就 意味 着 避免 了 “新 来 者 ”和 已 经 处 于 等 待 状态 的 计算 机 之 间 的 
冲突 ， 因 为 “新 来 者 ”需要 等 到 一 直 处 于 等 待 状态 的 计算 机 开始 传输 之 后 ， 才 能 允许 占用 空闲 
的 信道 。 

然而 ， 该 协议 无 法 解决 隐藏 终端 问题 。 毕 竟 ， 任 何 基于 辨别 空闲 或 者 繁忙 信道 的 协议 都 需 
要 每 个 站 点 能 够 监听 到 其 他 所 有 站 点 。 为 了 解决 这 一 问题 ， 一 些 WiFi 网 络 要 求 每 台 计 算 机 向 接 
入 氮肥 大 何 短 的 “请 求 ” 报 文 ， 并 等 待 接 入 点 确认 收 到 请 求 ， 然 后 再 传输 完整 的 报 文 。 如 果 接 
入 氮 由 于 正在 处 理 “ 隐 藏 终端 ”而 处 于 繁忙 状态 ， 将 会 忽略 请 求 ， 然 后 请 求 的 计算 机 将 获悉 并 
等 待 。 否 则 ， 接 入 点 会 确认 请 求 ， 并 且 计 算 机 将 获悉 现在 进行 传输 是 安全 的 。 注 意 ， 尽 管 计算 
机 无 法 监听 到 正在 发 生 的 报 文 传输 ， 但 是 网 络 中 所 有 的 计算 机 都 能 监听 到 接 入 点 发 出 的 确认 ， 
因此 就 能 知道 接 入 点 在 任何 特定 的 时 间 是 否 繁 忙 。 


4.1.3 网络 互 连 


有 时 候 需 要 连接 现存 的 网 络 以 形成 一 个 扩展 的 通信 系统 ， 形 成 相同 类 型 的 更 大 的 网 络 。 例 
如 ， 对 于 基于 以 太 网 协议 的 总 线 网 络 ， 经 常 可 以 将 总 线 连接 起 来 以 形成 一 个 长 总 线 。 它 是 利用 
中 继 器 、 网 桥 、 交 换 机 等 不 同 的 设备 完成 的 ， 这 些 设 备 区 别 微妙 旦 很 有 意思 。 最 简单 的 是 中 继 「 避 
钙 〈repeater)， 它 仅仅 是 在 两 个 原始 总 线 间 简单 地 来 回 传送 信号 的 设备 〈 通 常 有 某 种 形式 的 放 
大 )， 而 不 会 考虑 信号 的 含义 〔 如 图 4-4a 所 示 )。 

网 桥 《bridge) 藉 似 于 中 继 器 ， 但 是 更 复杂 一 些 。 它 也 是 连接 两 条 总 线 ， 但 是 它 不 必 在 线路 
上 传输 所 有 的 报 文 。 相 反 ， 网 桥 要 检查 每 条 报 文 的 目的 地 址 ， 并 且 当 该 报 文 的 目的 地 是 另 一 边 
的 计算 机 时 才 将 其 在 线路 上 传输 。 因 此 ， 在 网 桥 同 一 侧 的 两 台 计 算 机 不 需要 打扰 另 一 边 的 通信 
怠 可 以 互相 传输 报 文 。 相 对 于 中 继 器 ， 网 桥 形 成 的 系统 更 加 高 效率 。 

交换 机 〈switch》 本质 上 就 是 具有 多 连接 的 网 桥 ， 可 以 连接 若干 条 总 线 ， 不 止 两 条 。 因 此 ， 
交换机 形成 的 网 络 包括 若干 从 交换 机 延伸 出 来 的 总 线 ， 它们 就 类 似 于 车 轮 的 辐 条 (图 4-4b)。 与 
网 桥 一 样 ， 交 换 机 也 要 考虑 所 有 报 文 的 目的 地 址 ， 并 且 仅 仅 转发 那些 目的 地 是 其 他 辐 条 的 报 文 。 
此 外 ， 被 转发 的 报 文 只 会 送 至 相应 的 辐 条 ， 因 此 减轻 了 每 根 辐 条 的 传输 流量 。 


请 冀 中 继 可 门口 全 于 口 日 





(al 中 继 器 或 网 桥 连 接 两 个 总 线 型 网 络 (人 b) 区 换 机 连接 志 个 总 线 型 网 络 
图 4-4 ”将 小 型 总 线 网 组 建成 大 型 总 线 网 
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需要 注意 的 是 ， 当 计算 机 通过 中 继 器 、 网 桥 以 及 交换 机 连接 时 得 到 的 是 一 个 大 网 络 。 整 个 
系统 用 相同 的 方式 运作 〔 使 用 相同 的 协议 )， 就 像 每 个 初始 规模 较 小 的 网 络 一 样 。 

然而 ， 连 接 起 来 的 网 络 有 时 候 会 有 不 兼容 的 特性 。 例 如 ，WiFi 网 络 的 特性 就 可 能 与 以 太 网 
网 络 不 兼容 。 在 这 种 情况 下 ， 网 络 必须 按 建 立 一 个 网 络 的 网 络 〈 称 为 因特网 (intemet) ) 方式 连 
接 。 在 这 个 网 络 中 ， 原 始 的 网 络 仍然 保持 其 独立 性 ， 并 且 继 续 作为 单独 的 网 络 运行 。 (注意 ， 普 
通 名 词 因特网 (intemet) 不 同 于 因特网 (Intermnet)。 后 者 首 字母 要 大 写 ， 指 的 是 一 种 独特 的 、 
世界 范围 的 因特网 ， 在 本 章 的 其 他 节 会 学 到 。 还 有 许多 因特网 的 例子 。 事 实 上 ， 在 因特网 流行 
之 前 ， 传 统 的 电话 通信 就 是 由 世界 范围 的 因特网 系统 来 操控 的 。) 

把 网 络 连结 起 来 形成 因特网 的 设备 是 路 由 器 (router)， 这 是 一 种 用 来 传送 报 文 的 专用 计算 
机 。 注 意 ， 路 由 器 的 任务 与 中 继 器 、 网 桥 和 交换 机 的 不 同 ， 路 由 器 提供 了 网 络 之 间 的 链接 ， 并 
允许 每 个 网 络 保持 它 独特 的 内 部 特性 。 作 为 一 个 例子 ， 图 4-5 描 述 了 通过 路 由 器 组 连接 两 个 WiEi 
坚 瑟 网 络 和 一 个 以 太 网 总 线 网 络 的 情形 。 当 WiFi 网 络 中 的 一 台 计 算 机 想 要 给 以 太 网 中 的 一 台 计 
得 机 发 送 报 文 时 ， 它 首先 会 把 报 文 发 送 到 其 网 络 中 的 接 入 点 ， 接 入 点 再 把 报 文 发 送 到 与 之 相连 
的 路 由 器 ， 该 路 由 器 把 报 文 转发 至 以 太 网 中 的 路 由 器 。 在 那里 该 报 文 被 发 送 给 总 线 上 的 一 台 计 
算 机 ， 然 后 这 台 计 算 机 把 报 文 转 发 到 它 在 以 太 网 中 的 最 终 目 的 地 。 


) j WiFi 网 络 


地 AF 
SS 本 路 由 只 





8 路 由 器 愉 太 网 


WiFi 网 络 


图 45 路 由 器 连结 了 两 个 WiFi 网 络 和 一 个 以 太 网 络 ， 形 成 了 一 个 因特网 


路 由 器 得 名 的 原因 在 于 它 的 用 途 是 向 适当 的 方向 转发 报 文 。 这 个 转发 过 程 是 基于 因特网 范 
围 的 寻 址 系统 ， 其 中 因特网 上 的 所 有 设备 〈 包 括 原始 的 网 络 中 的 计算 机 和 路 由 器 ) 都 被 赋予 了 
唯一 的 地 址 《这样 ， 原 始 网 络 中 的 每 台 计算 机 都 有 两 个 地 址 ;自己 网 络 内 的 “本地 ”地 址 和 它 
的 因特网 地 址 。) 一 台 计 算 机 想 给 远 处 网 络 中 的 另 一 台 计算 机 发 送 报 文 , 就 要 附 上 报 文 的 目的 地 
的 因特网 地 址 ， 然 后 把 报 文 发 送 给 本 地 的 路 由 器 。 在 那里 报 文 将 向 正确 的 方向 转发 。 为 了 转发 
这 个 目的 ， 每 个 路 由 器 都 维护 了 -一 张 转 发 表 (forwarding table)， 该 表 中 包含 了 条 据 目 的 地 地 址 
消息 应 该 发 送 的 方向 等 路 由 知识 。 

一 个 网 络 与 因特网 链接 的 “点 ”经 常 被 称 为 网 关 〈gateway)， 因 为 它 是 作为 网 络 与 外 部 世 
乔 之 则 的 通道 。 网 关 有 多 种 形式 ， 因 而 这 个 术语 使 用 起 来 相当 宽松 。 在 许多 情况 下 ， 网 络 的 网 
关 仅 仅 是 路 由 器 ， 通 过 它 网 络 能 与 其 他 的 因特网 进行 通信 。 在 其 他 的 情况 下 ， 玉 语 网 关 所 指 的 
可 能 个 仅仅 是 一 台 路 由 器 。 例 如 ， 在 连接 到 因特网 的 多 数 住宅 WIFI 网 络 中 ， 术 语 网 关 所 指 的 是 
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网 络 的 接 入 点 和 与 接 入 点 相连 的 路 由 器 ， 因 为 这 两 个 设备 通常 是 安装 在 一 个 单元 中 。 


4.1.4 进程 间 通 信和 的 方法 


一 个 网 络 中 ， 在 不 同 计算 机 上 执行 《甚至 在 一 台 计 算 机 通过 分 时 /多 任务 处 理 执行 的 各 种 
泪 动 〈 或 进程 ) 必须 经 常 互 相通 信 ， 以 便 协 调 行动 ， 并 完成 指派 的 任务 。 这 种 过 程 之 间 的 通信 
称 为 进程 间 通 信 (interprocess communication ) 。 

进程 间 通 信 通 常 采用 的 是 客户 机 /服务 器 〈clientyserver) 模型 。 这 种 模型 规定 二 进 程 的 基本 角 
色 : 或 者 是 向 其 他 进程 提出 要 求 的 客户 机 (〈client)， 或 埋 是 满足 其 他 进程 要 求 的 服务 器 〈server )。 

客户 机 /服务 器 模型 最 初 应 用 于 连接 办 公 室 间 的 所 有 计算 机 的 网 络 。 这 样 ， 网 络 中 的 所 有 计 
算 机 部 可 以 使 用 连接 到 该 网 络 上 的 性 能 良好 的 打印 机 ， 在 这 种 情况 下 ， 打印 机 的 角色 就 是 服务 
证 《前 称 为 打印 服务 器 ，print server)， 其 他 计算 机 则 为 客户 机 ， 传递 打印 要 求 给 打印 服务 器 。 

客户 机 /服务 器 模型 的 另外 一 种 早期 应 用 是 ; 用 于 减少 磁盘 存储 开销 以 及 复制 记录 的 需要 。 
在 这 种 情况 下 ， 网 络 中 的 某 一 台 计 算 机 需要 配置 高 质量 海量 存储 系统 〈 通 前 是 磁盘 )， 存 储 所 有 
部 门 的 记录 ， 那 么 网 络 中 其 他 计算 机 就 可 以 在 需要 这 些 记录 时 提出 请 求 。 于 是 ， 包 含 记 录 的 计 
算 机 的 角色 就 是 服务 器 ， 称 为 文件 服务 器 (file server)， 和 而 翔 尝 加 文件 服务 器 提出 读 取 请 求 的 计 
算 机 就 扮演 客户 机 的 角色 。 

客户 机 /服务 器 模型 在 当今 的 网 络 中 应 用 更 为 广泛 ， 在 本 章 后 面 几 节 会 了 解 到 这 一 点 。 不 过 ， 
客户 机 /服务 器 模型 不 是 进程 间 通 信 的 唯一 方式 ， 为 外 一 种 是 对 等 (peer-to-peer, 通常 简称 为 P2P) 
模型 ， 它 与 前 者 的 特性 极为 不 同 。 客 户 机 /服务 器 模型 为 一 个 进程 (服务 器 ) 与 男 外 多 个 进程 ( 客 
户 机 ) 通信 ， 而 对 等 模型 为 两 个 进程 间 对 等 通信 〔 见 图 4.6)。 而 且 ， 服务 器 必须 持续 运作 ， 以 
使 随时 服务 于 客户 机 ， 但 是 对 等 模型 涉及 的 则 是 临时 执行 的 进程 。 例 如 ， 对 等 模型 的 应 用 包括 
发 送 即时 消息 ， 其 中 大 们 通过 因特网 进行 文字 的 交流 ， 也 可 以 是 人 们 玩 交 互 式 游 戏 。 


人 


服务 器 


(a) 服务 器 在 任何 时 候 都 必须 准备 好 为 多 个 客户 机 服务 





对 等 体 “ 可 一 一 一 对 等 体 
lb) 两 个 进程 在 一 对 一 的 基础 上 平等 地 通信 
图 4-6 客户 机 /服务 器 模型 与 对 等 模型 的 比较 


对 等 模型 也 是 分 发 文件 〈 如 因特网 上 的 音乐 和 电影 ) 的 常用 方法 。 在 这 种 情况 下 ， 一 个 对 
诗 体 可 以 从 另 一 个 对 等 体 接收 文件 ， 然 后 把 此 文件 提供 给 其 他 的 对 等 体 。 以 这 种 方式 参与 分 发 
的 集合 有 时 称 为 蜂 群 (Swarm )。 文件 分 发 的 蜂 群 方法 与 先前 使 用 客户 机 /服务 器 模型 的 方法 相 
反 ， 该 模式 需要 建立 中 央 分 发 中 心服 务 器 )， 以 使 客户 端 从 该 中 心 下 载 文件 《或 至 少 是 找到 那 
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龌 文件 的 源 )。 

从 文件 共享 的 角度 来 看 ，P2P 模 型 替代 客户 机 /服务 器 模型 的 一 个 原因 在 于 它 把 服务 分 布 到 
许多 的 对 等 体 上 ， 而 不 是 集中 在 一 个 服务 器 上 。 这 种 非 集中 化 的 操作 构建 了 更 高 效 的 系统 。 遗 
伍 的 是 ， 基 于 P2P 模 型 的 文件 分 发 系统 流行 的 另 一 个 原因 在 于 【〈 假 设 合法 性 遭 到 质疑 ) 缺乏 中 
心服 务 器 使 得 版 权 执 法 行动 变 得 更 为 困难 。 但 是 ， 也 存在 许多 案例 ， 有 些 人 发 现 “ 困 难 ” 并 不 
意味 着 “不 可 能 ”， 并 且 由 于 对 版 权 的 侵犯 ， 他 们 发 现 自己 面临 着 重大 的 责任 。 

你 可 能 经 常 读 到 或 者 听 到 “对 等 网 络 ” 这 个 说 法 ， 这 个 例子 正好 说 明了 ， 非 科技 界 采 用 科 
技术 语 时 产生 的 误 用 。“ 对 等 ” 指 的 是 两 个 进程 通过 网 络 〈 或 者 因特网 ) 通信 的 一 种 系统 ， 并 不 
征 网 络 《〈 或 者 因特网 ) 的 一 种 特性 。 一 个 进程 可 以 开始 采用 对 等 模型 与 另外 一 个 进程 通信 ， 接 
大 又 采用 客户 机 /服务 器 模型 通过 同一 个 网 络 与 另外 的 进程 通信 。 因 此 ， 精 确 地 说 应 该 是 利用 对 
等 模型 通信 ， 而 不 是 通过 对 等 网 络 通信 。 


4.1.5 分 布 式 系统 


随 着 组 网 技术 的 进步 ， 计 算 机 之 间 通 过 网 络 的 交互 已 经 很 普遍 ， 并 且 涉及 方方面面 。 许多 
现代 软件 系统 ， 例 如 ， 全 球 信息 检索 系统 、 公 司 范 围 的 会 计 和 库存 系统 、 计算 机 游戏 甚至 操控 
网 络 基 础 设施 本 身 的 软件 ， 都 被 设计 成 分 布 式 系统 〈distributed system)。 这 意味 着 ， 它们 由 在 
网 络 中 不 同 计算 机 上 作为 进程 执行 的 软件 单元 组 成 。 

分 布 式 系统 最 开始 是 独立 开发 的 。 不 过 ， 今天 的 研究 已 经 发 现在 这 些 系统 之 间 可 以 使 用 公 
共 的 基础 设施 ， 例 如 通信 系统 以 及 安全 系统 。 于 是 ， 人 们 开始 努力 后 产能 够 提供 这 种 基础 设施 
的 预制 系统 。 因 此 要 构建 一 个 分 布 式 应 用 ， 只 南 要 开发 系统 中 应 用 所 特有 的 部 分 即 可 。 

这 种 设计 的 一 个 成 果 是 出 现 了 称 为 Enterprise JavaBeans《〈 企 业 级 JavaBeans) 的 系统 《由 Sun 
公司 开发 ), 这 是 一 种 用 于 协助 构建 新 型 分 布 式 软件 系统 的 开发 环境 。 使 用 Enterprise JavaBeans， 
分 布 式 计算 机 系统 由 称 为 Bean 的 单元 构建 ， 这 个 单元 自动 继承 了 企业 的 基础 设施 。 因 此 ， 只 有 
独立 于 新 型 系统 那 部 分 独特 的 应 用 必须 开发 .另外 一 种 方法 是 称 为 .NET Framework(. NET 框 契 ) 
的 系统 《由 微软 公司 开发 )。 根 据 .NET 术语， 分 布 式 系统 中 的 部 件 称 为 配件 。 相 应 地 ， 通过 开 
发 .NET 环境 中 的 这 些 单元 , 只 有 那些 针对 特殊 应 用 的 独特 特性 需要 被 构建 一 一 因为 基础 设施 是 
预制 的 。 


问题 与 练习 

1. 什么 是 开放 式 网 络 ? 

2 归纳 中 继 器 及 网 桥 之 间 的 区 别 。 

3. 什么 是 路 由 器 ? 

4 列举 一 些 符 合 客户 机 / 服务 器 横 型 的 社会 中 的 关系 。 
5. 列举 一 些 社会 上 应 用 的 协议 。 


ri | 让 站 = 1 了 和 1 0 


4< 因特网 

因特网 中 最 著名 的 例子 就 是 因特网 (Internet， 注 意 首 字母 是 大 写 )， 它 起 源 于 20 世 纪 60 年 代 
的 研究 项 目 。 它 的 目的 是 开发 出 将 许多 计算 机 网 络 链接 起 来 的 能 力 ， 这 样 ， 这 些 计 算 机 就 是 作 
为 一 个 连接 系统 的 功能 ， 而 这 个 系统 不 会 由 于 局 部 灾难 而 被 破坏 。 这 个 项 目 的 工作 绝 大 部 分 是 
由 美国 政府 资助 并 通过 美国 国防 部 高 级 研究 计划 署 〈Defense Advanced Research Projects 
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Agency，DARFA) 发 起 的 。 经 过 这 人 么 多 年 ， 因 特 网 的 开发 已 经 从 政府 资助 的 项 目 转变 成 了 学 术 
研究 项 目 。 如 今 ， 在 很 大 程度 上 ， 它 已 经 是 商业 项 目 了 ， 连 接 全 世界 局 域 网 、 城 域 网 及 广域网 ， 
涉及 上 百 万 台 计 算 机 。 


4.2.1 因特网 体系 结构 


正如 我 们 已 经 提 到 的 ， 因 特 网 是 相连 网 络 的 集合 。 总 体 上 ， 这 些 网 络 的 构建 和 维护 是 由 因 
特 网 服务 提供 商 〈JInternet Service Provide，ISP) 来 完成 的 。 怠 网 络 本 身 而 言 ， 通 常 也 习惯 使 用 
术语 ISP 来 表示 网 络 本 身 。 因 此 ， 当 我 们 说 到 要 连接 到 一 个 ISP 时 ， 我 们 真正 的 意思 是 连接 到 由 
ISP 所 提供 的 网 络 。 
由 JSP 运作 的 网 络 系统 可 以 按照 它们 在 整个 因特网 结构 中 所 起 的 作用 分 类 成 屋 次 结构 《如 图 
4-7 所 示 )。 整个 层次 结构 的 顶部 是 数量 相对 较 少 的 第 一 层 ISP (tier-1ISP)， 这 些 ISP 拥 有 非常 高 速 、 
高 容量 的 国际 化 广域网 。 这 些 网 络 被 看 成 是 因特网 的 主干 ， 它们 基本 上 是 由 通信 行业 中 的 大 公司 
来 运作 的 。 例 如 ， 有 一 家 公司 最 初 是 传统 的 电话 公司 ， 后 来 它们 把 范围 扩展 到 提供 其 他 通信 服务 。 
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图 4-7 ”因特网 的 构成 
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第 二 代 因 特 网 
既然 因特网 已 经 由 科研 项 目 转 变 成 一 种 日 常 产 品 ， 科 研 界 于 是 转向 了 称 为 芝 二 代 因 特 网 
(JInternet2 ) 的 项 目 。 他 们 打 具 将 其 定位 于 学 术 系 统 ， 涉及 许多 与 工业 及 政府 有 合作 关 共 的 大 
学 。 目 标 是 在 一 个 需要 高 带宽 的 因特网 应 用 中 进行 科研 ， 包 括 远程 访问 及 控制 日 贵 的 最 新 型 
设备 ， 例 如 望远镜 和 医学 诊断 仪器 。 现 在 的 一 个 科研 例子 是 : 由 机 器 人 的 手 实施 远程 外 科 手 
术 ， 该 机 器 人 的 手 模仿 远程 外 科 医 生 的 手 ， 而 该 外 科 医 生 通过 视频 观察 病人 ， 你 可 以 通过 网 
站 http:y/Awww.internet2 -OrG 了 解 到 更 多 关于 第 二 代 因 特 网 的 信息 。 


与 第 一 层 ISP 连 接 的 是 第 二 层 ISP (tier-2 ISP )， 第 二 层 因特网 服务 提供 商 往往 是 区 域 性 的 ， 
在 实力 上 也 稍 逊 一 些 。 (第 一 层 和 第 二 层 因 特 网 服务 提供 商 的 区 别 通 常 是 观点 上 的 问题 。) 此 外 ， 
这 些 网 络 通常 也 是 由 通信 行业 的 公司 运营 。 
第 一 层 和 第 二 层 因 特 网 服务 提供 商 本 质 上 是 路 由 器 的 网 络 ， 集中 提供 因特网 通信 基础 设施 。 
它们 同样 可 以 被 认为 是 因特网 的 核心 。 通 单 由 称 为 因特网 接 入 服务 提供 商 〈access ISP) 的 中 间 
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商 提 供与 核心 的 接 入 服务 。 因 特 网 接 入 服务 提供 商 本 质 上 是 独立 的 因特网 ， 有 时 也 称 之 为 内 联 
网 〈intranet)， 由 疝 个 人 用 户 提 供 因 特 网 接 入 业务 的 机 构 来 运营 。 这 些 公 司 包 插 AOL、Microsoft 
以 及 本 地 通过 提供 服务 收取 服务 费 的 电线 和 电话 公司 ， 另 外 还 包 插 一 些 大 学 或 者 公司 等 组 织 ， 
它们 为 组 织 内 部 的 个 人 用 户 提供 因特网 接 和 人 。 

个 人 人 用户 与 因特网 接 入 服务 提 供 商 连接 的 设备 被 称 为 终端 系统 (end system) 或 者 主机 
(host)。 这 些 终端 系统 并 不 一 定 是 传统 意义 上 的 计算 机 。 它们 包括 很 多 种 设备 ， 如 电话 、 摄 像 
机 、 汽 车 和 家 用 电器 。 毕 竟 ， 因 特 网 本 质 上 是 一 个 通信 系统 ， 因 此 任何 可 以 与 其 他 设备 进行 通 
信 并 从 中 获奖 的 设备 都 可 以 成 为 潜在 的 终端 系统 。 

终端 系统 与 因特网 接 入 服务 提供 商 连 接 的 技术 也 不 尽 相 同 。 或 许 ， 发 展 最 快 的 是 基于 WiFi 
技术 的 无 线 连接 。 策 略 是 将 接 入 点 与 因特网 接 入 服务 提供 商 相 连接 ， 因 此 可 以 在 接 入 点 的 广播 
范围 内 通过 因特网 接 入 服务 提供 商 向 终端 系统 提供 因特网 接 入 。 接 入 点 范围 内 的 区 域 通常 被 称 
为 热点 (hot spot)。 热 点 和 热点 组 的 范围 日 益 广 泛 ， 包 括 个 人 住宅 、 酒 店 和 写字 楼 、 小 型 企业 、 
公园 ， 甚 全 有 些 情况 下 是 整个 城市 。 目 前 手机 行业 也 使 用 相似 的 技术 ， 在 手机 行业 中 ， 热 点 就 
是 我 们 所 知 的 服务 区 ， 当 终端 系统 从 一 个 服务 区 移动 到 另 一 个 服务 区 时 ， 通 过 调整 控 制服 务 区 
的 “路 由 器 ”来 提供 连续 的 服务 。 

连接 因特网 接 和 信服 务 提 供 商 的 其 他 稼 见 技 术 包 括 使 用 电话 线 或 者 电线 /卫星 系统 。 这 些 技术 
可 以 用 来 提供 对 单个 终端 系统 的 直接 连接 , 或 者 连接 客户 的 路 由 器 从 而 实现 连接 多 个 终端 系统 。 
后 一 种 方法 在 个 人 住宅 中 普 过 存在 ， 利 用 现 有 的 电线 或 者 电话 线 ， 通 过 连接 因特网 接 入 服务 提 
供 商 的 路 由 器 / 接 入 点 形成 本 地 热点 。 

现 有 的 电线 和 卫星 链接 与 商 速 数据 传输 的 兼容 性 要 比 与 传统 电话 线 的 兼容 性 好 ， 电 话 线 最 
初 是 想 和 语音 通信 共同 安装 的 。 但 是 ， 已 经 制定 了 一 些 更 明智 的 方案 ， 从 而 拓展 了 这 些 连接 ， 
可 以 适应 数字 数据 的 传输 。 这 些 连 接 使 用 了 名 为 调制 解 调 器 (modem) (modulatordemodulator 
的 简称 ) 的 装置 ， 该 朔 置 将 数字 数据 转换 为 可 以 与 使 用 的 传输 媒介 兼容 的 格式 。 例 如 ， 数 字 用 
户 线 路 (Digital Subscriber Line，DSL)， 低 于 4 干 赫兹 的 频率 范围 用 来 满足 传统 的 语音 通信 ， 而 
更 喜 的 频率 则 用 来 传输 数字 数据 。 此 外 ， 胃 为 陈旧 的 方法 是 将 数字 数据 转换 为 语音 数据 ， 然 后 
使 用 和 语音 传输 一 样 的 方式 进行 传送 。 后 一 种 方法 被 称 为 拨号 连接 〈dial-up access)， 事 实 上 ， 
拨号 连接 用 于 临时 连接 ， 用 户 使 用 传统 方式 拨 通 因特网 接 信 服务 提供 商 的 路 由 器 ， 然 后 将 其 电 
话 与 要 使 用 的 终端 系统 连接 。 由 于 拨号 连接 成 本 低 并 且 容 易 利 用 ， 目 前 依然 得 到 广泛 使 用 。 但 
是 ， 拨 号 连接 数据 传输 速度 较 低 ， 无 法 满足 当今 需要 实时 视频 通信 或 者 大 量 数据 传输 的 因特网 
应 用 。 


4.2.2 ”因特网 编 址 


如 4.1 玉 所 介绍 的 ， 一 个 因特网 必须 与 一 个 因特网 范围 的 编 址 系统 相连 接 ， 这 个 系统 将 赋予 
该 系统 中 每 个 计算 机 唯一 的 标识 地 址 。 在 因特网 中 ， 这 些 地 址 称 为 I|P 地 址 〈IP addresse)。(IP 指 
的 是 网 际 协议 ， 我 们 在 4.4 节 中 会 更 多 地 了 解 这 个 术语 。) 每 一 个 耳 地址 都 是 32 位 的 位 模式 ， 但 
是 为 了 提供 更 多 的 地 址 ， 人 们 现在 正 计 划 将 其 扩展 到 128 位 〈 人 参见 4.4 节 关于 IPv6 的 详 述 )。 因 特 
网 名 称 与 数字 地 址 分 配 机 构 (The Internet Corporation for Assigned Names and Numbers，ICANN ) 
呵 因 特 网 服务 提供 商 提供 了 大 量 连续 数字 的 下 地 址 ， 因 特 网 名 称 与 数字 地 址 分 配 机 构 是 一 家 非 
营利 性 的 国际 组 织 ， 致 力 于 协调 因特网 的 运营 。 然 后 ， 因 特 网 服务 提供 商 就 可 以 对 他 们 授权 范 
围 内 的 计算 机 分 配 正 地址。 因此， 因特网 上 的 计算 机 都 分 配 了 唯一 的 IP 地 址 。 

IP 地 址 通常 是 采用 点 分 十 进 制 记 数 法 〈dotted decimal notation ) 书写 的 ， 其 中 地 址 的 每 个 字 
节 用 圆 点 分 隔 ， 每 个 字 节 用 传统 的 十 进 制 整数 表示 。 例 如 ， 使 用 点 分 十 进 制 记 数 法 ， 位 模式 5.2 
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将 可 以 表示 2 字 节 位 模式 0000010100000010， 其 中 包含 字 节 00000101 (5 的 表示 )， 接 下 来 是 字 节 
00000010 (2 的 表示 ); 而 位 模式 17.12.25 将 可 以 表示 3 字 节 的 位 模式 ,其 中 包含 字 节 00010001 (用 
二 进 制 记 数 法 表示 为 17)， 然 后 是 字 节 00001100〈 用 二 进 制 记 数 法 表示 为 12)， 最 后 是 字 节 
00011001《 用 二 进 制 记 数 法 表示 为 23)。 总 之 ， 当 用 点 分 十 进 制 记 法 表示 时 ，32 位 的 耳 地 址 可 以 
表示 为 192.207.177.133。 

用 位 模式 表示 的 地 址 〈 即 使 采用 点 分 十 进 制 记 数 法 压缩 ) 难以 帮助 人 们 理解 。 基于 这 个 原 
因 , 因特网 拥有 另外 一 种 编 址 系统 , 利用 助 记 名 称 来 识别 计算 机 。 该 编 址 系统 是 基于 域 (domain) 
的 概念 ， 可 以 认为 是 如 大 学 、 俱 乐 部 、 公 司 、 或 者 政府 机 构 等 单个 机 构 操作 的 因特网 的 “区 域 ”。 
(我 们 将 会 看 到 ， 此 处 引用 区 域 一 词 可 能 不 同 于 因特网 的 物理 区 域 。) 每 一 个 域 都 必须 在 因特网 
名 称 与 数字 地 址 分 配 机 构 进行 注册 ， 这 一 过 程 由 注册 商 〈registrar) 公司 操作 ， 注册 商 由 因特网 
名 称 与 数字 地 址 分 配 机 构 指定 。 作 为 注册 流程 的 一 部 分 ， 助 记 域名 会 分 配给 域 ， 域名 在 因特网 
中 征 唯 一 的 。 域 名 通常 是 注册 域 的 机 构 的 描述 ， 从 而 提高 他 们 在 用 户 中 的 使 用 性 。 

例如 ，Addison-Wesley 出 版 公司 的 域名 是 aw.com。 需 要 注意 的 是 ， 这 个 命名 系统 反映 了 域 
的 分 类 , 在 这 个 域名 中 , 后 com 就 表明 了 其 商业 性 。 这 个 类 别称 为 顶级 域名 (Top-Level Domain， 
TLD)。 人 存在 若干 个 顶级 域名 ， 例 如 ，edu 表 示 教 育 系 统 ，goev 表 示 政 府 机 构 ，org 表 示 非 营利 机 
构 ，museum 表 示 博 物 馆 ，info 表 示 信 息 服务 机 构 ， 还 有 net， 它 最 初 打算 用 于 表示 因特网 服务 
提供 商 ， 但 是 现在 使 用 的 范围 更 广 一 些 。 除 了 这 些 一 般 的 TLD 外 ， 也 有 用 于 表示 特定 国家 的 2 
字母 TILD〈 称 为 国家 代码 顶级 域名 )， 例 如 ，au 表 示 澳 大 利 亚 ，ca 表 示 加 拿 大 。 

一 旦 一 个 域 的 助 记 名 被 注册 ， 注 册 该 域名 的 机 构 可 以 在 域内 自由 扩展 名 称 ， 为 个 体 项 获取 
助 记 标识 符 。 例 如，Addison-Wesley 出 版 公司 内 的 单个 计算 机 可 以 标识 为 ssenerprise.aw,.com。 
注意 ， 域 名 是 向 左 扩展 的 ， 并 用 句点 分 开 。 在 一 些 情 况 下 ， 称 为 子 域 subdomain 的 多 个 扩展 
用 作 在 域内 组 织 名 称 的 方法 。 这 些 子 域 通 常 代表 域 管辖 内 不 同 的 网 络 。 例 如 ， 如 果 Nowhere 大 
字 注 册 的 域名 为 nowhereu .edu, 那么 Nowhere 大 学 的 个 体 计算 机 的 域名 可 以 为 2d2 .compsc . 
nowhereu.edu， 其 含义 是 顶级 域名 为 eau， 域 名 为 nowhereu， 子 域名 为 compsc， 名 为 2Q2 
的 计算 机 . (我们 需要 注意 的 是 在 助 记 地 址 中 使 用 的 反 分 十 进 制 记 数 法 与 位 组 合格 式 的 地 址 中 使 
用 的 点 十 进 制 记号 没有 关系 。) 

虽然 助 记 地 址 对 于 用 户 来 说 比较 方便 ， 但 是 因特网 中 还 是 使 用 PP 地 址 来 传输 消息 。 因 此 ， 
如 果 用 户 想 要 给 远程 计算 机 传输 消息 并 通过 助 记 地 址 来 标识 目的 地 ， 那么 使 用 的 软件 必须 能 够 
将 地 址 转换 成 耳 地 址 ， 然 后 才能 传输 消息 。 这 种 转换 可 以 通过 域名 服务 器 〈name server) 来 完 
成 ， 其 实 它 是 可 以 向 客户 端 提供 地 址 解析 服务 的 目录 。 这 些 域名 服务 器 都 共同 作为 因特网 范围 
内 的 目录 系统 ， 称 为 域名 系统 (Domain Name System，DNS )。 使 用 域名 系统 进行 解析 的 过 程 称 
为 域名 系统 查找 (DNS Lookup )。 

因此 ， 如 果 一 台 计 算 机 可 以 通过 助 记 域名 连接 ， 那么 这 个 域名 必须 存在 于 域名 系统 内 的 域 
名 服务 器 上 。 例 如 ， 在 一 些 示 例 中 ， 注 册 了 域名 的 实体 就 拥有 资源 ， 它 可 以 在 域内 建立 并 维护 
包含 所 有 名 称 的 域名 服务 器 。 事 实 上 ， 这 就 是 域名 系统 最 初 基于 的 模式 。 每 一 个 注册 域 都 代表 
了 本 地 机 构 所 运行 因特网 的 物理 区 域 ， 如 公司 、 学 校 或 者 政府 机 构 。 实 际 上 ， 这 个 机 构 就 是 一 
个 因特网 接 入 服务 提供 商 ， 通过 与 因特网 连接 的 内 联网 向 其 成 员 提供 因特网 接 入 。 作 为 该 系统 
的 一 部 分 ， 机 构 维护 自己 的 域名 服务 器 ， 为 域 中 使 用 的 所 有 名 称 提供 解析 服务 ， 

目前 ， 这 种 模式 依然 很 常见 。 然 而 ， 许多 个 体 或 者 小 型 机 构想 要 建立 展示 在 因特网 上 的 域 ， 
但 却 不 想 承 担 必 要 的 支持 资源 。 例 如 ， 一 家 本 地 国际 象棋 俱乐部 想 要 在 因特网 上 展示 为 
Kingsanaoueens.org, 但 是 俱乐部 不 想 购买 资源 建立 自己 的 网 络 、 维 护 网 络 与 因特网 的 连接 ， 
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并 实施 自己 的 域名 服务 器 。 这 种 情况 下 ， 俱 乐 部 可 以 和 因特网 服务 提供 商 签 订 合 同 ， 使 用 因 特 


网 服务 提供 商 已 经 建 好 的 资源 实现 注册 域名 的 展示 。 俱 乐 部 一 般 可 能 会 通过 因特网 服务 提供 商 
的 帮助 ， 注 册 由 俱乐部 选 好 的 域名 ， 并 与 因特网 服务 提供 商 签 订 合 同 将 域名 放 入 因特网 服务 提 
供 商 的 域名 服务 器 。 这 就 意味 着 所 有 关于 新 域名 的 域名 系统 查找 都 会 直接 指向 因特网 服务 提供 
商 的 域名 服务 器 ， 从 而 获取 正确 的 域名 解析 。 通 过 这 种 方法 ， 许 多 注册 的 域名 就 可 以 存在 一 个 
因特网 服务 提供 商 的 域名 服务 器 中 ， 每 个 域名 只 占用 一 台 计 算 机 的 很 小 一 部 分 。 


4.2.3 ”因特网 应 用 


在 这 一 小 节 中 ， 我 们 从 3 项 传统 的 应 用 开始 ， 论 述 因 特 网 的 一 些 应 用 。 但 是 ， 这 些 “ 传 统 ” 
的 应 用 不 足以 反映 当今 因特网 的 全 犁 。 事 实 上 ， 计 算 机 和 其 他 电子 设备 的 区 别 已 经 变 得 含混 不 
清 。 电 话 、 电 视 、 音 响 系 统 、 防 资 自 动 警 铃 、 微 波 炉 和 摄像 机 都 成 为 潜在 的 “因特网 设备 ” 此 
外 ， 因 特 网 的 传统 应 用 在 新 应 用 的 大 量 扩展 下 相形 见 细 ， 新 的 应 用 包括 即时 消息 、 视 频 会 议 、 
因特网 电话 和 因特网 广播 。 毕 竟 ， 因 特 网 只 是 一 个 传输 数据 的 通信 系统 。 随 着 技术 不 断 提 高 系 
统 的 传输 速度 ， 传 输 的 数据 内 容 就 仅仅 受到 人 们 想象 力 的 限制 。 因 此 ， 我 们 将 介绍 两 种 较 新 的 
内 特 网 应 用 〈 电 话 和 广播 )， 以 展示 与 当今 新 兴 因 特 网 相关 的 问题 ， 其 中 包括 其 他 网 络 协议 标准 
的 需求 ， 因 特 网 与 其 他 通信 系统 链接 的 需求 ， 以 及 扩展 因特网 路 由 器 功能 的 需求 。 

1. 电子 邮件 

因特网 最 利 见 的 用 途 之 一 就 是 电子 邮件 〈E-mail， 是 electronic mail 的 缩写 )， 电 子 邮 件 系统 
可 以 在 因特网 用 户 之 间 传 输 信息 。 为 了 提供 电子 邮件 服务 ， 每 个 域 的 本 地 机 构 要 在 其 域内 指定 
一 台 计 算 机 ， 用 以 处 理 该 域 中 的 电子 邮件 活动 。 这 人 台 计 算 机 就 被 称 为 该 域 的 邮件 服务 器 “mail 
server)。 通 贡 ， 为 了 问 域内 的 用 户 提供 邮件 服务 ， 因 特 网 接 入 服务 提供 商都 会 在 其 域内 建立 电 
子 邮 件 服务 器 。 当 一 名 用 户 在 其 本 地 计算 机 上 发 送 电子 邮件 ， 邮 件 会 首先 传送 到 用 户 的 邮件 服 
务 嚣 上。 然后 邮件 服务 器 会 将 邮件 转发 至 目的 地 邮件 服务 器 上 ， 目 的 地 邮件 服务 器 会 一 直 保 存 
邮件 ， 直 到 收 件 人 联系 邮件 服务 器 并 请 求 查看 收 到 的 邮件 。 

在 邮件 服务 器 之 间 传 输 邮 件 或 者 从 作者 的 本 地 计算 机 向 邮件 服务 器 发 送 新 消息 所 使 用 的 网 
络 协议 是 简单 邮件 传输 协议 〈Simple Mail Transfer Protocol, SMTP)。 由 于 简单 邮件 传输 协议 最 
急 是 为 传输 ASCI 编 码 的 文本 信息 而 设计 的 ， 因 此 又 开发 了 多 用 途 因特网 邮件 扩展 〈Multipurpose 
Intemnet Mail Extensions, MIME ) 协议 ,将 非 ASCI 编 码 的 数据 转换 成 简单 邮件 传输 协议 兼容 的 格式 。 

有 两 种 和 常见 的 协议 可 以 用 于 访问 到 达 和 存储 在 用 户 邮件 服务 器 的 电子 邮件 ; 邮局 协议 版 本 3 
(Fost Office Protocol Version 3, POP3) 和 因特网 邮件 访问 协议 〈Intermet Mail Access Protocol， 
IMAP)。 二 者 中 ， 邮 局 协议 版 本 3 (POP3， 读 作 pop-three) 较为 简单 。 使 用 POP3， 用 户 可 以 向 
其 耕地 计算 机 发 送 〔 下 载 ) 邮件 ， 在 本 地 计算 机 的 中 读 取 、 在 不 同文 件 夹 中 存储 ， 并 可 以 随意 
编辑 或 者 操作 那些 邮件 。 这 些 操作 都 是 通过 使 用 本 地 机 器 的 大 容量 存储 器 在 用 户 的 本 地 机 器 上 
完成 的 。IMAP《〈 读 作 EYE-map) 支持 用 户 在 与 邮件 服务 器 相同 的 计算 机 上 存储 和 操作 邮件 以 及 
相关 的 资料 。 这 样 ， 必 须 在 其 他 计算 机 上 收取 邮件 的 用 户 ， 就 可 以 先 在 邮件 服务 器 上 保存 一 封 
邮件 ， 随 后 ， 用 户 可 以 通过 任何 远程 计算 机 来 访问 这 封 邮 件 。 上 

了 解 邮 件 服 务 器 的 作用 后 , 我 们 就 很 容易 明白 单个 邮件 地 址 的 结构 了 。 它 有 一 个 符号 串 ( 有 
时 候 称 为 账户 名 )， 表 示 某 个 人 ， 然 后 是 符号 @ 〈 读 做 at)， 最 后 是 助 记 串 ， 表 示 接 收 该 邮件 的 
邮件 服务 器 。( 事 实 上， 这 个 串通 常 只 表明 目标 域 ， 该 域 的 邮件 服务 器 最 终 是 要 通过 DNS 查找 来 
表示 的 。) 因 此 ， Addison-Wesley 上 的 某 个 人 的 邮件 地 址 很 可 能 是 shakespeareeaw， com 换 人 铅 话 说 ， 
一 条 发 送 到 这 个 地 点 的 报 文 将 发 送 到 域名 为 aw.com 域 的 邮件 服务 器 上 , 该 报 文 一 直 保 存在 邮件 
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服务 器 中 ， 以 便 符 号 串 shakespeare 标 识 的 人 查看 邮件 。 

2. 文件 传输 协议 

传输 文件 《如 文档 、 照 片 或 者 其 他 编码 信息 ) 的 一 种 方法 是 将 其 作为 附件 附 在 电子 邮件 中 。 
不 过 一 种 更 有 效 的 方法 是 利用 文件 传输 协议 〈EFile Transfer Protocol，FTP)， 它 是 一 种 在 因特网 
上 传输 文件 的 客户 机 /服务 器 协议 。 使 用 FETP 传 输 文 件 ， 因 特 网 中 一 台 计 算 机 的 用 户 需要 使 用 一 
个 实现 FTP 的 软件 包 ， 然 后 与 另外 一 台 计 算 机 建立 连接 。(〈 最 初 的 计算 机 相当 于 客户 机 ， 它 所 连 
接 上 的 计算 机 相当 于 服务 器 ， 通 常 称 为 FTP 服 务 器 。) 一 旦 建立 了 这 个 连接 ， 文 件 就 可 以 在 两 台 
计算 机 之 间 以 任意 方向 传输 了 。 

FTIP 已 经 成 为 因特网 上 提供 安 限 数据 访问 的 访 行 方式 。 例 旭 ， 人 假设 你 打算 允许 一 部 分 人 检 
索 某 文件 ， 但 是 禁止 其 他 人 人 访问。 于是， 你 仅仅 需要 用 FTP 服务器 设备 将 该 文件 存 入 一 台 计 算 
机 ， 然 后 通过 口令 限制 对 该 文件 的 访问 权限 。 然 后 ， 知 道口 令 的 人 们 就 可 以 通过 FTP 访 问 该 文 
件 ， 而 其 他 人 就 会 被 拒绝 访问 。 在 因特网 中 使 用 这 种 方式 的 计算 机 通常 被 称 为 FTP 站 点 ， 因 为 
它 威 为 因特网 上 可 以 通过 FTP 使 用 文件 的 地 方 。 

FTP 站 点 也 用 于 提供 不 受 限 的 文件 访问 。 为 了 实现 这 个 目的 ，FTP 服 务 器 要 使 用 术语 
anonymous〈 革 名 ) 作为 通用 口令 。 这 些 地 点 经 常 被 称 为 匿名 FTP (anonymous FTP) 站 点 ， 并 
因此 提供 不 受 限 的 文件 访问 权限 。 

常常 混 消 的 两 个 FTP 概 念 是 “文本 文件 ”和 “二 进 制 文件 ?。 较 新 的 FTP 工 具 往 往 对 用 户 屏 
苹 这 一 问题 ,但 这 个 问题 反映 了 在 计算 机 之 间 传 输 数 据 的 某 些 障碍 ， 因 此 我 们 有 必要 解释 清楚 。 
早期 使 用 的 电 传 打印 机 打印 一 个 文本 文档 时 ， 换 行 不 仅 需 要 换行 《垂直 移动 )， 还 需要 回 车 (水 
平移 动 ), 这 两 个 符号 都 分 别 用 ASCI 码 编码 。( 换 行 由 位 模式 00001010 表 示 , 但 是 回 车 由 00001101 
表示 。) 为 了 提高 效率 ， 许 多 早期 的 程序 员 发 现 ， 只 使 用 其 中 一 个 编码 来 表示 断 行 会 很 方便 。 例 
如 ， 如 果 每 个 人 都 同意 只 使 用 回 车 ， 而 不 是 既 要 回 车 又 要 换行 来 表示 断 行 ， 那 么 该 文档 中 每 一 
行 吏 会 节省 8 个 二 进 制 位 的 文件 空间 。 人 们 需要 做 的 只 是 在 打印 文件 时 遇 到 回 车 要 加 入 一 个 换 
行 。 这 种 简 洛 的 方式 一 直 沿 用 至 今 。 具 体 来 说 ，UNIX 操 作 系 统 假定 ， 文 本 文件 中 的 断 行 只 由 一 
个 换行 表示 ， 苹果 公 司 开 发 的 系统 只 使 用 回 车 ， 微 软 公司 的 软件 既 使 用 回 车 又 使 用 换行 。 于 是 ， 
这 些 文件 在 各 个 系统 之 间 传 输 时 就 必须 转换 。 

这 就 导致 了 FTP 中 “文本 文件 ”与 “二 进 制 文件 ”之 间 的 区 别 。 如 果 一 个 文件 作为 “文本 
文件 ”使 用 FTP 传 输 ， 那 么 转换 就 成 为 了 传输 过 程 的 一 部 分 ， 如 果 该 文件 是 作为 “二 进 制 文件 ” 
传输 ， 那 么 吏 不 需要 转换 。 因 此 ， 即 便 你 可 能 将 使 用 文字 处 理 器 编辑 的 文件 看 作 是 文本 ， 该 文 
件 也 是 不 能 够 作为 “文本 文件 ”传输 的 ， 因 为 这 些 文件 使 用 特殊 代码 来 表示 回 车 和 换行 。 如 果 
这 样 的 “二 进 制 文 件 ” 航 个 然 当 作 “ 文 本 文件 ”传输 ， 它 就 会 被 无 意识 地 更 改 。 

3. 远程 登录 与 安全 壳 

因特网 的 一 个 早期 应 用 是 ， 允 许 计算 机 用 户 在 很 远 的 距离 访问 计算 机 。 远 程 登录 〈Telnet) 
是 为 了 这 个 目的 而 建立 的 一 个 协议 系统 。 使 用 远程 登录 ， 一 个 用 户 【 运 行 远程 登录 客户 端 软件 ) 
可 以 与 远程 计算 机 的 远程 登录 服务 器 〈 软 件 ) 取得 联系 ， 然 后 遵循 那个 操作 系统 的 登录 步骤 获 
取 对 那 台 计算 机 的 访问 权 。 这 样 ， 通 过 远程 登录 ， 远 程 用户 拥 有 与 本 地 用 户 相 同 的 对 应 用 和 工 
具 的 访问 权限 。 

由 于 管 设计 于 因特网 发 展 初 期 ， 远 程 登录 有 许多 的 缺点 。 其 中 一 个 较为 严重 的 是 ， 通 过 远 
程 登录 的 通信 是 没有 加 密 的 。 即 使 通信 的 主题 不 敏感 ， 这 个 问题 也 很 严重 。 因 为 用 户 的 口令 也 
是 登录 过 程 中 通信 的 一 部 分 。 因 此 ， 使 用 远程 登录 就 可 能 给 偷盗 者 获取 口令 的 机 会 ， 然 后 小 用 
重要 信息 。 安 全 这 (Secure Shell，SSH) 是 解决 这 个 问题 的 一 个 远程 登录 候选 方法 ， 而 且 迅 速 
代 蔡 了 远程 登录 。SSH 的 特征 是 ， 它 给 传输 中 的 数据 提供 加 密 ， 以 及 验证 〈4.5 节 )， 验 证 过 程 就 
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是 确定 通信 的 两 台 计 算 机 的 身份 。 

4. VoIP 

作为 最 近 的 因特网 应 用 的 一 个 例子 ，VoIP《〈Vpice over Intemmet Protocol) 是 利用 因特网 基础 
芭 施 ， 提 供与 传统 电话 系统 类 似 的 语音 通信 。 它 的 最 简单 的 形式 是 : VoIP 由 不 同 机 器 上 的 两 个 
进程 构成 ， 这 些 机 器 通过 P2P 模 式 传输 音频 数据 一 一 这 个 进程 本 身 没 有 明显 的 问题 。 但 是 ， 初 
妇 化 和 接受 呼叫 ， 把 VoIP 与 传统 电话 系统 链接 ， 以 及 提供 像 紧急 911 通 信 这 样 的 服务 ， 诸 如 此 类 
的 问题 是 超过 了 传统 的 因特网 应 用 范畴 的 。 而 且 ， 拥有 国家 传统 电话 公司 的 政府 把 VoIP 看 成 是 
一 种 威胁 ， 对 它们 征收 很 高 的 税 ， 或 彻底 宣布 它们 为 不 合法 。 考 虑 到 这 些 复杂 的 情况 ， 再 加 上 
VoP 正 在 努力 找寻 普遍 接受 的 协议 标准 的 事实 ， 这 意味 着 VoIP 未 来 的 发 展 方向 仍 不 确定 。 

同时 ， 现 人 存 的 VoIP 系统 为 通用 性 而 竞争。 其 中 一 个 例子 就 是 Skype， 它 由 允许 PC 用 户 呼 叫 
其 他 Skype 用 户 ， 并 与 其 通信 的 软件 构成 。 Skype 还 为 它 的 客户 提供 了 与 传统 电话 通信 系统 的 链 
接 。Skype 的 一 个 缺点 是 它 是 一 个 专 有 系统 , 因而 许多 操作 结构 是 不 对 外 公开 的 ， 这 意味 着 Skype 
用 户 必须 要 在 没有 第 三 方 论证 的 基础 上 相信 Skype 软 件 的 完整 性 。 例 如 ， 为 了 接收 呼叫 ， 9kype 
用 户 必 须 把 他 的 《或 她 的 )，PC 与 因特网 相连 ， 并 且 Skype 系 统 是 可 用 的 ， 这 网 意 味 着 在 PC 机 主 
守 无 意识 的 情况 下 ，PC 的 一 些 资源 可 能 会 被 用 来 支持 其 他 的 Skype 通 信 〈 这 一 功能 引起 了 -- 些 
抵制 )。 

5. 远程 因特网 广播 

已 一 个 最 近 的 因特网 应 用 是 广播 站 节目 的 传播 ， 这 个 过 程 称 之 为 网 站 广播 ， 与 原先 的 广播 
相对 应 ， 因 为 信号 是 通过 因特网 传送 的 ， 而 不 是 通过 空中 传送 。 更 准确 地 ， 因 特 网 广播 是 音频 
流 (Streaming audio) 的 一 个 具体 示例 ， 它 是 指 在 实时 基准 上 传送 声音 数据 。 

从 表面 上 看 ， 因 特 网 广播 似乎 不 需要 特殊 的 考虑 ， 人 们 可 能 猜想 到 一 个 站 点 仅 需 建立 一 台 
服务 器 ， 它 把 节目 消息 发 送 给 请 求 它们 的 每 个 客户 端 。 这 种 技术 就 是 众所周知 的 多 点 传播 
4Nrunicast)。( 更 准确 地 ， 单 点 传播 是 指 一 个 发 送 者 向 一 个 接收 者 发 送 消息 ， 而 多 点 传播 是 指 一 
个 及 送 者 涉及 多 个 单 点 传播 .) 多 点 传播 方法 已 经 被 使 用 ， 但 这 种 方法 具有 缺陷 ， 它 却 把 真正 的 
负担 放 在 站 服务 器 上 和 与 服务 器 紧邻 的 因特网 邻居 上 。 实 际 上 ， 多 点 传播 强迫 服务 器 按照 实时 
基准 把 各 条 消息 发 送 给 它 的 每 个 客户 端 ， 而 所 有 这 些 信息 必须 再 由 服务 器 的 邻居 转发 。 

大 多 数 多 点 传播 的 候选 方法 都 试图 缓和 这 个 问题 。 其 中 一 种 方法 是 使 用 过 去 的 文件 共享 系 
统 方法 中 的 P2P 模 型 。 也 就 是 说 ， 一 旦 一 个 对 等 体 已 经 接收 到 数据 ， 那 它 就 开始 把 数据 分 发 到 
那 邑 正在 等 待 的 对 等 体 ， 这 意味 着 分 发 的 大 多 数 问题 是 从 数据 源 到 对 等 体 的 传送 。 

妨 外 一 种 候选 方法 称 之 为 多 路 广播 (multicast)， 它 把 分 发 问题 传送 给 因特网 中 的 路 由 器 。 
使 用 多 路 广播 ， 服 务 器 通过 单个 地 址 把 消息 传送 给 多 个 客户 端 ， 依 顿 因特网 中 的 路 由 器 来 识别 
这 个 地 址 的 含义 ， 生 产 且 转发 消息 的 副本 到 合适 的 目的 地 。 在 多 路 广播 中 使 用 的 这 个 地 址 称 之 
为 组 地 址 ， 它 由 特别 的 起 始 位 模式 来 标识 ， 其 他 的 位 用 来 标识 广播 站 ， 这 在 多 路 广播 术语 中 称 
之 为 组 。 当 一 个 客户 端 要 从 特殊 的 站 接收 消息 时 ( 想 要 订购 一 个 特殊 的 组 )， 它 把 这 个 愿望 通知 
给 最 近 的 路 由 器 。 这 个 路 由 器 本 质 上 把 这 个 请 求 向 前 传送 到 因特网 ， 这 样 其 他 的 路 由 器 将 会 把 
所 有 带 有 这 个 组 地 址 的 信息 向 这 个 客户 方向 传送 。 简 喜之 ， 当 使 用 了 多 路 广播 ， 服 务 器 只 发 送 
程序 的 一 个 副本 ， 而 不 管 有 多 少 个 客户 在 接收 ， 而 把 这 些 信 息 按 需 复制 和 把 它们 路 由 到 合适 的 
目的 地 ， 那 是 路 由 器 的 职责 。 注 意 ， 依 顿 多 路 广播 的 应 用 需要 因特网 路 由 器 具有 的 功能 超过 它 
原来 的 职责 范围 。 这 是 当前 使 用 的 一 种 处 理 方式 。 

我 们 看 到 因特网 广播 在 搜索 它 的 基础 的 过 程 中 〈 像 VoIP 一 样 ) 逐渐 流行 。 未 来 到 底 会 发 生 
什么 并 不 明确 ， 但 随 着 因特网 基础 设施 功能 的 继续 扩展 ， 网 站 广播 的 应 用 肯定 会 随 之 发 展 。 实 
际 上 ， 因 特 网 电视 也 著 势 待 发 。 
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问题 与 练习 

1. 第 一 屋 和 第 二 层 ISP 的 作用 是 什么 ? 因特网 接 入 服务 提供 商 的 作用 是 什 玄 ? 

. DNS 是 什么 ? 

. 用 氮 分 十 进 制 记 数 法 表示 ，3.4.5 代 表 什么 位 模式 ? 用 点 分 十 进 制 记 数 法 表示 位 模式 0001001100010000。 

. 计算 机 在 因特网 中 的 助 记 地 址 《例如 r2d2 .compsc .nowhereu ,edu ) 结构 在 哪些 方面 与 传统 的 邮件 
地 址 相似 ? 在 下 地 址 中 也 会 出 现 同 样 的 结构 吗 ? 

. 列 出 因特网 上 发 现 的 3 种 服务 器 ， 并 说 出 每 种 的 用 途 。 

为 什么 人 们 认为 SSH 比 远程 登录 高 级 ? 

因特网 广播 的 P2P 和 多 路 广播 方法 与 多 点 广播 在 广播 方式 上 有 何 种 不 同 ? 


[上 站 
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本 他 将 考虑 一 种 因特网 应 用 ， 多 媒体 信息 就 是 通过 它 在 因特网 上 传播 的 。 这 个 术语 基于 超 
文本 〈hypertext) 的 概念 ， 最 初 指 的 是 包含 指向 其 他 文档 的 链接 的 文本 文档 ， 该 链接 称 为 超 链 
接 (hyperlink)。 今 天 ， 超 文本 已 经 扩展 到 了 包含 图 像 、 音 频 以 及 视频 ， 而 且 由 于 其 范围 的 扩大 ， 
它 有 时 候 也 被 称 为 超 媒体 (hypermedia )。 

使 用 GUI 时， 超 文 本 文档 的 读者 只 需要 用 鼠标 点 击 超 链 接 就 可 以 获取 与 它 相关 联 的 内 容 。 
例如 ， 假 设 语句 “这 个 管弦 乐队 演奏 Maurice Ravel 的 “Bolero” 精 彩 极 了 ”出 现在 一 个 超 文本 
文档 中 ， 而 且 名 字 Maurice Ravel 与 另外 一 个 文档 链接 一 一 也 许 提 供 了 该 作曲 者 的 信息 。 读 者 可 
以 选择 用 忌 标 点 击 名 字 Maurice Ravel 以 查看 相关 信息 。 而 且 ， 如 果 安 置 了 恰当 的 超 链接 ， 读 者 
还 可 以 通过 用 鼠标 点 击 名 字 Bolero 收听 到 该 演奏 的 音频 。 

通过 这 种 方式 ， 超 文本 文档 的 读者 就 可 以 查阅 相关 的 文档 ， 或 者 跟随 思考 的 顺序 ， 一 个 文 
档 一 个 文档 地 查看 。 由 于 各 个 文档 的 许多 部 分 都 与 其 他 文档 相 链 接 ， 于 是 就 形成 了 一 个 相关 信 
息 的 相互 缠绕 的 网 状 组 织 。 当 在 计算 机 网 络 中 实现 时 ， 存在 于 网 状 组 织 的 这 些 文档 就 可 以 存在 
于 不 同 的 计算 机 上 ， 形 成 了 网 络 范围 的 网 状 组 织 。 在 因特网 上 发 展 起 来 的 网 状 组 织 已 经 遍布 全 
球 ， 被 称 为 万 维 网 《World Wide Web， 也 称 WWW、W3 或 者 Web)。 万 维 网 上 的 超 文本 文档 通 
常 称 为 网 页 (Web page)。 紧 密 相 关 的 一 组 网 页 称 为 网 站 (website )。 

万 维 网 要 源 于 Tim Berners-Lee 所 做 出 的 努力 ,他 实现 了 链接 文档 概念 与 因特网 技术 的 结合 ， 
并 于 1990 年 12 月 开发 出 了 第 一 个 实现 万 维 网 的 软件 。 


4.3.1 万维网 实现 


允许 用 户 访 问 因特网 上 超 文本 的 软件 包 分 为 两 类 ; 扮演 客户 角色 的 包 和 扮演 服务 器 端 角色 的 
包 。 客 户 端 软件 包 安装 在 用 户 的 计算 机 上 ， 负 责 获取 用 户 要 求 的 材料 ， 并 将 这 些 材料 条 理 清 晰 地 
展示 给 用 户 。 客 户 端 提供 给 客户 一 个 界面 ， 允 许 其 在 网 络 上 浏览 。 因 此 ， 客户 帆 芝 被 称 为 浏览 器 
(browser) 或 者 是 万 维 网 浏览 器 。 服 务 器 软件 包 〔〈 通 常 称 为 万 维 网 服务 器 ，Web server) 放 在 含 
有 符 读 取 的 超 文本 文档 的 计算 机 中 。 它 的 任务 是 根据 客户 端的 请 求 提 供 对 机 器 里 文档 的 访问 权 。 
妨 之 ， 用 户 通过 他 计算 机 里 的 浏览 器 获得 对 超 文 本 文档 的 访问 权 。 充 当 客 户 端的 浏览 器 通过 向 闹 
布 因特网 上 的 万 维 网 服务 器 提出 请 求 服务 而 访问 那些 文档 。 超 文本 文档 通常 是 使 用 称 为 超 文本 传 
输 协议 〈Hypertext Transfer Protocol，HTTP) 的 协议 在 浏览 器 与 万 维 网 服务 器 之 问 传输 。 

为 了 在 万 维 网 上 定位 及 检索 文档 ， 每 个 文档 都 被 赋予 了 唯一 的 -一 个 地 址 ， 称 为 统一 资源 定 
位 符 〈Uniform Resource Locator，URL)。 每 个 URL 都 包含 浏览 器 要 连接 到 正确 的 服务 器 以 及 


上 
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请 求 希 望 的 文档 所 需要 的 信息 。 因 此 ， 为 了 浏览 网 页 ， 人 们 要 首先 提供 给 浏览 器 所 需要 文档 的 
URL， 然 后 要 求 该 浏览 器 去 检索 和 显示 这 个 文档 。 8 

图 4-8 给 出 了 一 个 典型 的 URL， 它 包含 4 段 : 与 服务 器 进行 通信 并 控制 文档 的 存 取 协 议 ， 
服务 器 所 在 的 机 器 的 助 记 地 址 ， 目 录 路 径 供 服务 器 找到 存放 该 文档 的 目录 ， 以 及 该 文档 的 名 字 。 
简 言 之 ， 图 4-8 上 的 URL 告知 浏览 器 : 使 用 HTTP 协议 与 称 为 assenterbrise_.aw .conm 的 计 
算 机 上 万 维 网 服务 器 连接 ， 并 检索 名 为 Julius-caesar.html 的 文档 ， 该 文档 存放 在 authors 
目录 内 的 子 目 录 Shakespeare 中 。 


用 下 蕊 交 /7 总 总 站 七 间 下 让 下 守 训 让 辣 册 -已 总 琶 / 二 让 在 抽 癌 苦 生 大 攻 二 其 让 和 税 丫 辣 站 间 关 于 条 于 主 由 总- 全 吕 三 喇 疫 二 技巧 由 于 


保 仔 该 葡 档 的 主机 助 记 符 文档 名 


访问 该 文档 所 需要 的 协 指示 该 文档 在 该 主机 文 
议 。 这 里 是 超 文 本 传输 件 系 统 中 的 位 置 
协议 【http ) 


图 4-8 典型 的 URL 


有 时 候 ，URL 可 能 不 会 包含 图 4-8 中 所 示 的 所 有 字段 。 例 如 ， 如 果 服 务 器 不 需要 根据 目录 
路 径 去 读 那个 文档 ， 那 么 URL 中 就 不 会 出 现 目录 路 径 。 此 外 ， 有 时 候 一 个 URL 只 包含 一 个 协 
以 以 及 一 台 计 算 机 的 助 记 地 址 。 在 这 些 情况 下 ， 该 计算 机 的 万 维 网 服务 器 将 返回 预定 的 一 个 文 
档 ， 它 通常 称 为 主页 ， 一 般 描 述 该 网 站 可 用 的 信息 。 这 种 缩短 了 的 URL 使 得 联系 各 种 机 构 的 方 
法 变 得 更 简单 。 例 如 ，URL http: /www.aw.com 表示 Addison-Wesley 公司 的 主页 ， 它 包含 许 
多 超 链 接 ， 可 以 了 解 到 该 公司 及 其 产品 的 许多 文档 。 

为 了 进一步 简化 定位 网 站 ， 许 多 浏览 器 都 假定 : 如 果 无 法 确定 协议 ， 就 使 用 HTTP 协 议 。 当 
“URL” 只 包含 www.aw.com 时 ， 这 些 浏 览 器 准确 地 检索 到 了 Addison-Wesley 公 司 的 主页 。 


万 维 网 联盟 


万 维 网 联盟 ( World World Web Consortium，W3C ) 创建 于 1994 年 ， 宗 四 是 通过 开发 协议 
标准 〔 称 为 W3C 标 准 ) 来 促进 万 维 网 的 发 展 。W3C 总 部 设 在 瑞士 日 内 瓦 欧洲 粒子 物理 研究 所 
(CCERN ) 疝 能 粒子 物理 实验 室 。CERN 是 原来 的 HTML 标 记 语 言 和 用 于 在 因特网 上 传输 HTMHL 
文档 的 HTTP 协 议 的 诞生 地 。 今 天 的 W3C 是 许多 标准 (包括 用 于 XML 和 许多 多 媒体 应 用 的 标 
准 ) 的 源头 ， 过 些 标 准 使 得 大 范围 的 因特网 产品 得 到 兼容 ， 在 网 站 PRttp: 1 下: 上， 
你 可 以 了 解 到 关于 W3C 的 更 多 信息 . 


4.3.2 HTML 


一 个 超 文本 文档 类 似 于 传统 的 文本 文档 ， 因 为 它们 的 正文 是 使 用 诸如 ASCII 或 者 Unicode 
系统 一 个 字符 接 一 个 字符 地 编码 的 。 区 别 是 ， 超 文本 文档 还 包含 称 为 标记 (Ctag) 的 专用 符号 ， 
用 于 雪 示 该 文档 应 该 如 何 旺 现 在 显示 器 上 和 该 文档 还 需要 什么 多 媒体 资源 (如 图 像 )， 以 及 该 文 
档 的 哪些 项 链接 到 其 他 文档 上 。 这 个 标记 的 系统 称 为 超 文 本 标记 语言 《Hypertext Markup 
Language，HTIML )。 
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页 呈现 在 用 户 的 显示 器 上 ， 并 找到 当前 网 页 所 引用 的 任何 相关 文档 。 该 过 程 类 似 于 向 单纯 的 打 
印 文档 《也 许 使 用 一 个 红色 的 笔 ) 加 入 排版 命令 ， 所 以 该 排 字 机 就 会 知道 该 材料 最 后 应 该 以 什 
人 么 形式 出 现 。 对 于 超 文本 ，HTML 标记 代替 了 红色 记号 ， 浏 览 器 最 终 充 当 了 排 字 机 的 角色 ， 读 
取 HTML 标记 就 会 知道 文本 会 以 什么 方式 呈现 在 计算 机 显示 器 上 。 

4-9a 给 出 了 一 个 非常 简单 的 网 页 的 HTML 编码 版 本 〈 称 为 源 版 本 )。 注 意 ， 标 记 是 用 
符号 “<” 和 “>” 括 起 来 的 。HTML 源 文档 由 两 段 组 成 一 一 首部 〈 由 标记 <head> 和 -</heaaq> 
括 住 ) 和 主体 〈 由 <boay> 和 </boday> 括 住 )。 各 网 页 首部 和 主体 之 间 的 区 别 类 似 于 各 办 公 室 
备 否 录 的 首部 与 主体 之 间 的 区 别 。 两 者 都 是 : 首部 包含 该 文档 的 预备 性 信息 《例如 备忘录 的 
有 主题 等 ); 主体 包含 文档 的 实质 内 容 ， 对 于 网 页 就 是 该 页 可 能 会 呈现 在 计算 机 显示 器 上 

材料 。 
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指示 文档 结 上 | 天 的 生生 和 
东 的 标记 苹 炎 号 和 > 


(a 用 HTML 如 写 的 网 页 


My Web Page 


Click here for another page， 





人 b) 显示 在 计算 机 屏幕 上 的 网 页 


图 4-9 ”一 个 简单 的 网 页 


图 4-9a 给 出 的 网 页 的 首部 只 包含 了 该 文档 的 标题 〈 用 title 标 记 括 住 )。 该 标题 只 是 用 于 文 
目的 ， 并 不 会 显示 在 计算 机 显示 器 上 。 要 显示 在 计算 机 显示 器 上 的 材料 包含 在 文档 的 

图 4-9a 所 示 的 文档 主体 的 第 一 个 条 目 是 一 个 包含 文本 “My Web Page” 的 一 级 标题 (由 <hl> 
和 </h1> 标 记 括 住 )。 作 为 一 级 标题 意味 着 浏览 器 要 将 该 文档 明显 地 呈现 在 显示 器 上 。 主体 的 下 
一 个 条 目 是 文本 一 个 段落 〈 由 <p> 和 </p> 标 记 括 住 )， 和 包含 文本 “Click here for another page.”。 
图 4-9b 给 出 的 是 浏览 器 显示 在 计算 机 显示 器 上 的 页 面 。 

根据 它 现在 的 形式 ， 图 4-9 所 示 的 页 面 是 没有 实际 意义 的 。 用 户 点击 here 时 ， 什 么 也 不 会 发 


心 , 
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生 ， 虽 然 网 页 上 瞳 示 了 如 此 操作 会 使 得 浏览 器 打开 另外 一 个 网 页 。 为 了 引起 相关 的 活动 ， 我 们 
必须 将 单词 here 与 另外 一 个 文档 建立 链接 。 

假设， 扣 击 here 时 ， 我 们 打算 让 训 览 器 呈现 URL http:y//eraftvy.com/demo .html 的 网 
页 。 盲 先 ， 我 们 要 用 标记 <a> 和 </a> 将 该 网 页 源 版 本 的 单词 here 括 住 ， 这 对 标记 称 为 锚 标 记 。 
在 开销 标记 里 ， 我 们 要 插入 参数 


了 Tet= 了 tt 万 :ACEaELtyY .Comy demec .html 


《如 图 4-10a 所 示 ) 它 表 示 与 该 标记 相 联 系 的 超 文本 引用 (href) 设 定 在 等 号 后 面 的 URL 
(http:yVcratfty.comvdemo .html)。 加 上 另外 一 个 错 标 记 后 ， 该 网 页 就 会 如 图 4-10b 所 示 旺 
现在 计算 机 显示 器 上 了 。 注意 ， 它 与 图 4-9b 是 一 样 的 ， 只 是 单词 here 用 彩色 高 亮 显示 ， 为 了 表示 
它 是 与 另外 一 个 网 页 文档 的 链接 。 点 击 这 类 高 亮 显示 的 术语 就 会 使 得 浏览 器 检索 并 显示 相关 的 
网 册 文 档 。 因 此 ， 网 页 文档 是 通过 锚 标记 彼此 之 间 建 立 的 链接 。 
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所 蕊 开 七 二 全 革 避 章 的 起 亲 昌盛 甘南 臣 半 辣 这 ”了 苏 训 站 袜 了 七 二 七 王 所 > 
写 用 从 本 他 
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所 全 站 司 
闭 错 标 记 一 人 全 和 全 全 


让 局 扯 ”站 这 站 全 玖 站 三、 请 昌 旧 扯 ,过 让 > 


含有 参数 
的 错 标 记 一 








二 Or 
必 所 上 机 了 六 


(a) 用 HITML 搞 写 的 网 页 


MY Web Page 


Click here foranother page. 





(b) 显示 在 计算 机 屏幕 上 的 网 页 


图 4-10 增强 的 简单 网 页 


节 后 应 该 简要 说 明 一 下 ， 图 像 是 如 何 加 入 我 们 这 个 简单 的 网 页 的 。 为 此 ， 假 设 要 插入 的 
图 像 的 JPEG 编码 与 该 网 页 的 HTML 源 存储 在 HTTP 服务 器 站 点 中 相同 的 目录 下 。 然 后 ， 候 
设 该 图 像 文件 的 名 字 是 OurImage. jpg。 这样 , 在 HTML 源 文 档 的 <body> 标 记 后 揪 入 图 像 标 
记 <:img SIC = ”OUTIT 工 Tao 可 已 .所 吕 ">， 我 们 就 可 以 命令 浏览 器 在 该 网 页 的 顶部 显示 该 图 像 了 。 这 
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修 标 记 告诉 浏览 器 的 是 名 为 OurImage,]Pg 的 图 像 应 该 在 该 文档 的 开头 显示 。 (src 是 Source 
的 缩写 ， 意 思 是 等 号 后 面 的 信息 表示 的 是 要 显示 的 图 像 源 )。 当 浏览 器 发 现 这 个 标记 时 ， 它 就 会 
传输 给 HTTP 服务 器 一 条 报 文 ， 并 从 服务 器 获得 要 求 称 为 ourTmage. jpg 图 像 的 原始 文档 ， 并 
且 恰 当地 显示 该 图 像 。 

如 果 我 们 将 该 图 像 标记 移 到 文档 的 后 面 ， 就 在 </boday> 标 记 后 面 ， 那 么 该 浏览 器 就 会 在 该 
网 页 的 底部 显示 该 图 像 。 当 然 在 网 页 上 定位 图 像 还 有 许多 复杂 的 技术 ， 但 是 这 些 内 容 超 出 了 本 
书 讨论 的 范围 。 


4.3.3 欠 ML 


HTML 本 质 上 是 一 个 记号 系统 ， 一 个 文本 文档 以 及 该 文档 的 外 观 都 可 以 编码 成 一 个 简单 的 
文本 文件 。 同 理 ， 我 们 也 可 以 将 非 文本 材料 编码 成 文本 文件 ， 例 如 活页 乐谱 。 秆 -看 ， 传 统 上 
表示 音乐 的 五 线 谱 ， 节 拍 以 及 音符 都 不 符合 文本 文档 规定 的 一 个 字符 接着 一 个 字符 的 格式 。 不 
过 ， 我 们 可 以 通过 另外 一 种 符号 系统 来 克服 这 个 困难 。 精 确 地 说 ， 我 们 规定 ， 用 <staft 
clef="treble"> 表 示 五 线 谱 的 开始 ， 用 </staff> 表 示 五 线 谱 的 结束 ， 用 <time>274</time> 
表示 节拍 号 ， 用 <measure> 和 </measure> 分 别 表示 小 节 的 开始 和 结束 ， 用 <netes>egth C 
<Vnotes> 家 示 八 分 音符 CC， 等 等 。 那么 ， 文本 

<Statt+ Clef = "treble"> <key>C minor</kev> 

<tIme> 了 /4 </ 守 Inhe> 

<IIeaSUTe> <TreSt> egth </rest> <mnotes> egth G， 

egStD 已 ，egth 台 </notes></measure> 


< 和 提 SUT 忆 > < 二 DOLBS> 上 ] 诗 瑟 过 /OSImeaStuTre> 
民 / 号 七 己 芋 于 > 


如 可 以 用 于 编码 图 4-11 所 示 的 五 线 谱 。 使 用 这 种 符号 ， 乐 谱 就 可 以 作为 文本 编码 、 修 改 、 存 储 
和 在 因特网 上 传输 。 其 次 ， 还 可 以 编写 软件 ， 将 这 类 文件 的 内 容 以 传统 乐谱 的 形式 表现 出 来 ， 
甚至 可 以 用 一 个 音乐 合成 器 来 演奏 此 音乐 。 





图 4-11 贝多 芬 第 五 交响 乐 的 前 两 小 节 


注意 ， 我 们 的 乐谱 记号 系统 沿用 了 HTML 使 用 的 文体 。 对 于 标识 组 成 部 分 的 标记 ， 我 们 选 
择 用 符号 “<” 和 “>” 作 为 定 界 符 。 我 们 选择 用 相同 的 标记 名 表示 结构 (如 五 线 谱 ， 一 串 音 符 ， 
或 者 是 一 个 节拍 ) 的 开始 和 结束 一 一 表示 结束 的 那个 标记 加 入 一 个 斜 线 (以 <measure> 开 始 的 
以 </measure> 结 束 )。 我 们 选择 用 诸如 clef="treble" 的 标记 来 指定 特定 的 属性 。 这 种 文体 
还 可 以 用 于 开发 表示 其 他 格式 的 系统 ， 如 数学 表达 式 和 图 表 。 

可 扩展 标记 语言 〈(eXtensible Markup Language，XML) 是 一 种 标准 化 的 文体 〔〈 类 似 于 上 而 
乐谱 的 例子 )， 用 于 设计 将 数据 表示 为 文本 文件 的 符号 系统 。( 事 实 上 ， XML 是 一 种 比较 老 的 称 
为 标准 通用 标记 语言 (Standard Generalized Markup Language，SGML) 的 标准 的 简化 派生 物 。) 
脖 照 XML 标准 ， 人 们 已 经 开发 出 了 一 种 称 为 标记 语言 (markup language) 的 记号 系统 ， 用 于 表 
示 数 学 、 多 媒体 演示 以 及 音乐 。 事 实 上 ，HTML 是 一 种 基于 XML 标准 ， 为 表示 网 页 而 开发 的 标 
亿 语 言 。( 实 际 上 ， HIML 的 蛛 始 版 本 在 XML 标准 巩固 之 前 就 已 经 开发 出 来 了 ， 因 此 HTML 的 一 
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些 特征 不 是 很 严格 地 遵守 XML 。 正 是 这 个 原因 , 我 们 可 能 需要 参考 XHTML, 它 是 严格 遵守 XML 
的 HTML 版 本 。) 

关于 如 何 设计 标准 以 获得 广泛 应 用 , XML 提供 了 一 个 好 的 范例 。 对 于 编码 各 种 类 型 的 文档 ， 
并 不 是 设计 单独 的 、 无 关联 的 标记 语言 ，XML 所 表示 的 方法 是 开发 一 种 通用 标记 语言 标准 。 通 
过 这 个 标准 ， 就 可 以 为 各 种 应 用 开发 不 同 的 标记 语言 了 。 这 样 开 发 出 来 的 标记 语言 具有 一 致 性 ， 
可 以 组 合 起 来 以 获得 复杂 应 用 的 标记 语言 ， 例 如 包含 乐谱 片段 和 数学 表达 式 的 文本 文档 。 

最 后 要 说 明 的 是 ，XML 人 允许 开发 与 HTML 不 同 的 新 的 标记 语言 ， 因 为 它 强 调 的 是 语义 而 不 
是 词 本 身 。 例 如 ， 使 用 HTML 可 以 标记 菜谱 里 的 配料 ， 使 得 它们 以 列表 形式 出 现 ， 每 一 种 配料 
单独 占 一 行 。 不 过 ， 如 果 我 们 使 用 面向 语义 的 标记 ， 一 个 菜谱 里 的 配料 就 可 以 标记 为 配料 《也 
许 使 用 标记 <ingredaient> 和 </ingreaient>) 而 不 仅仅 是 列表 中 的 各 个 项 。 这 个 区 别 很 细微 
但 是 很 重要 。 语 义 方 法 使 得 搜索 引擎 〈search engine) 能 够 确定 哪些 菜谱 包含 或 者 不 包含 某 些 配 
料 ， 这 将 是 现在 搜索 引擎 技术 的 一 项 重大 改进 ， 因 为 现在 的 技术 只 能 够 分 离 出 含有 或 者 不 含有 
某 个 单词 的 菜谱 。 精 确 地 说 ， 如 果 使 用 语义 标记 ， 搜 索引 擎 就 可 以 找到 不 包含 菠菜 的 卤 汁 宽 面 ， 
而 只 根据 单词 内 容 的 类 似 的 搜索 就 会 跳 过 以 “这 个 击 汁 宽 面 不 包含 菠菜 ”开始 的 菜谱 。 同 样 ， 
如 打 因 特 网 范围 的 用 于 标记 文档 的 标准 都 是 根据 语义 而 不 是 词 本 身 制 订 的 ， 那 么 创建 的 是 万 维 
“语义 ”网 ， 而 不 是 现在 使 用 的 万 维 “ 语 法 ”网 


“4.3.4 客户 端 和 服务 器 端的 活动 


忆 


现在 我 们 来 考虑 一 下 ， 检 索 图 4-10 所 示 的 简单 网 页 ， 并 将 其 呈现 在 该 浏览 器 的 计算 机 的 显 
示 嚣 上， 那么 该 浏览 器 需要 哪些 步骤 ? 首先 ， 扮 演 客 户 角 色 的 浏览 器 要 使 用 URL (也 许 是 从 使 
用 该 计算 机 的 人 那里 获得 ) 里 的 信息 与 控制 对 该 网 页 存 取 的 万 维 网 页 服务 器 建立 连接 ， 然 后 请 
求 传输 给 它 该 页 的 一 个 副本 。 服务 器 然后 要 将 图 4-10a 上 显示 的 文档 送 给 浏览 器 作为 回应 。 然 后 ， 
浏览 器 将 解释 该 文档 中 的 HIML 标 记 ， 以 确定 如 何 显 示 该 网 页 ， 并 将 文档 呈现 在 计算 机 的 显示 
器 上 。 浏 览 器 的 用 户 就 将 看 到 如 图 4-10b 中 所 示 的 图 像 。 如 果 用 户 接着 用 鼠标 点 击 单词 here， 浏 
览 器 将 使 用 相关 联 的 销 标 记 中 的 URL 链接 到 恰当 的 服务 器 ， 以 获得 并 显示 另 一 个 网 页 。 总 之 ， 
整个 过 程 就 是 浏览 器 按照 用 户 的 要 求 搜索 及 显示 网 页 。 

但 是 ， 如 采 我 们 想 获得 一 个 带 有 动画 的 网 页 ， 或 者 是 一 个 允许 客户 填写 订单 并 提交 的 网 页 
呢 ? 这 些 需 求 就 需要 浏览 器 和 万 维 网 服务 器 付出 额外 的 行动 。 如 果 这 些 行动 由 客户 机 《【〈 如 浏览 
妖 ) 完成 则 称 为 客户 端 〈client-side ) 活动 如 果 由 服务 器 《如 万 维 网 服务 器 ) 完成 则 称 为 服务 
器 端 〈server-side) 活动 。 

例如 ， 假 设 旅行 社 想 要 客户 能 说 出 想 去 的 目的 地 和 旅行 日 期 ， 这 时 旅行 社 呈 现 给 客户 一 个 
定制 的 网 页 ， 该 网 页 上 只 包含 与 该 客户 需求 有 关 的 信息 。 在 这 种 情况 下 ， 旅 行 社 的 网 站 将 首先 
呈现 给 客户 一 个 可 供 选 择 的 旅游 目的 地 网 页 。 客 户 根据 这 个 信息 ， 指 定 感 兴趣 的 目的 地 和 旅行 
日 期 〈 客 岂 端 活动 )。 这 些 信息 将 被 传 回 给 旅行 社 的 服务 器 ,在 那里 这 些 信息 被 用 来 构建 合适 的 
定制 网 页 〈 服 务 器 端 活动 )， 这 个 网 页 将 被 发 送 给 客户 的 浏览 器 。 

为 外 一 个 例子 是 使 用 搜索 引擎 服务。 在 这 种 情况 下 ,客户 端的 用 户 指定 感 兴趣 的 主题 ( 客 
户 端 活动 )， 然 后 这 个 主题 被 传送 给 搜索 引擎 ， 在 那里 会 构建 识别 可 能 感 兴趣 文档 的 定制 网 页 
服务 器 端 活动 )， 然 后 发 回 给 客户 端 。 还 有 另外 一 个 例子 就 是 网 站 邮件 〔《Web mail) 一 一 一 种 
日 蔓 流 行 的 方法 , 通过 它 计算 机 用 户 能 通过 网 页 浏览 器 来 存 取 他 们 的 电子 邮件 。 在 这 种 情况 下 ， 
网 站 服务 器 是 客户 与 客户 邮件 服务 器 间 的 中 间 层 。 从 本 质 上 讲 ， 网 站 服务 器 构建 包含 有 来 自 邮 
件 服务 器 信息 《服务 器 端 活动 ) 的 网 页 ， 把 这 个 网 页 传送 给 客户 端 ， 在 那里 客户 端 浏览 器 显示 
它们 【客户 端 活动 )。 相 反 ， 训 览 器 支持 用 户 创建 消息 〈 客 户 端 活 动 )， 把 这 一 信息 传送 给 网 站 
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服务 器 ， 网 站 服务 器 再 把 这 些 消 息 转发 给 邮件 服务 器 〈 服 务 器 端 活动 )。 

实现 客户 端 和 服务 器 端 活 动 的 系统 有 很 多 ， 每 个 系统 与 其 他 系统 竞争 ， 看 谁 更 突出 。 每 个 都 力 
求 是 最 好 的 。 一 种 早期 但 现在 仍然 很 流行 的 控制 客户 端 活动 的 方法 是 ， 在 网 页 的 HTML 源 文档 中 包 
丘 用 JavaScript 语 言 〈《 由 网 景 (Netscape) 公司 开发 ) 编写 的 程序 . 服务 器 可 以 从 那里 获取 程序 并 根 
所 需要 执行 。 另 外 一 种 方法 〈 由 Sun 公 司 开发 ) 是 ， 首 先 将 一 个 网 页 传输 给 浏览 器 ， 然 后 将 称 为 小 
应 用 程序 《applet， 用 Java 语 言 编写 ) 的 额外 程序 单元 根据 HTML 源 文 档 的 要 求 传输 给 该 浏览 器 。 还 
有 一 种 方法 是 Flash 系 统 〈 由 Macromedia 公 司 2 开 发 )， 可 以 实现 扩展 的 多 媒体 客户 端 演示 。 

控制 服务 端 活 动 的 一 个 早期 方法 是 ， 使 用 一 组 称 为 公共 网 关 接 口 Common Gateway 
Interface，CGI) 的 标准 ， 客 户 通过 它 可 以 请 求 执行 存储 在 服务 器 中 的 程序 。 这 种 方法 “由 Sun 
公司 开发 ) 的 一 个 变 体 是 允许 客户 在 服务 器 端 执行 称 为 小 服务 程序 servlet) 的 程序 单元 。 如 
有 朱 所 请 求 的 服务 器 端 工作 是 创建 定制 的 网 页 ， 如 旅游 代理 的 例子 ， 那 么 就 可 以 使 用 小 服务 程序 
方法 的 一 种 简化 版 本 。 在 这 种 情况 下 ， 称 为 Java 服 务 器 页 面 (Java ServerPages，JSP) 的 网 页 模 
. 板 存 放 在 万 维 网 服务 器 里 ， 并 利用 从 客户 端 接 收 到 的 信息 完成 该 网 页 。 微 软 公 司 采 用 了 类 似 的 
方法 ， 构 建 定制 网 页 的 模板 称 为 活动 服务 器 页 面 (Active ServerPages，ASP)。 与 这 些 专 有 系 缠 
相对 ，PHP 是 一 种 实现 服务 器 端 功 能 的 开源 系统 。PHP 最 初 是 代表 个 人 主页 (Personal Home 
Page)， 现 在 指 的 是 PHP 超 文本 处 理 程序 (PHP Hypertext Processor)。 

最 后 ， 由 于 允许 客户 机 和 服务 器 在 另外 一 方 的 计算 机 上 执行 程序 ， 因 此 会 引发 一 些 安全 性 
门 题 和 道德 问题 ， 如 果 我 们 对 此 没有 清醒 的 认识 那 是 不 负责 任 的 。 万 维 网 服务 器 要 固定 地 给 客 
户 传 袜 要 执行 的 程序 ， 这 个 事实 给 服务 器 端 带 来 了 道德 问题 ， 并 相应 地 给 客户 端 带 来 了 安全 性 
问题 。 如 果 客 户 言 目地 执行 万 维 网 服务 器 发 送 来 的 任何 程序 ， 它 就 为 服务 器 的 恶意 行动 打开 了 
人 入门。 同 理 ， 客 户 机 可 以 让 程序 在 服务 器 端 执行 ， 这 因此 也 给 客户 端 带 来 了 道德 问题 ， 相 应 地 
给 服务 器 端 带 来 了 安全 性 问题 。 如 果 服 务 器 端 盲 目地 执行 客户 机 发 送 过 来 的 任何 程序 ， 那 么 安 
全 性 就 被 破坏 了 ， 并 因此 产生 了 潜在 的 危险 。 


问题 与 练习 
1 什么 是 URL? 什么 是 浏览 器 ? 
2. 什么 是 标记 语言 ? 
3. HIML 和 XML 的 区 别 是 什么 ? 
4. 下 列 每 个 HTML 标 记 的 功能 是 什么 ? 

a. <html> hb <head> ec</Abody> 灿 </a> 
5. 客户 端 和 服务 器 端 分 别 指 什么 ? 


ee 和 二 站 站 有 贡 TR 末 生生 愉 下 aa 上 有 本 有 所 站 和 让 


询 导 总 
4 医 
ww 号 


Re 


本 节 研 究 报 文 是 如 何在 因特网 上 传输 的 。 由 于 传输 过 程 需要 系统 中 所 有 计算 机 合作 ， 所 以 
控制 传输 过 程 的 软件 需要 驻 留 在 因特网 的 每 台 计算 机 中 。 我 们 衣 先 研究 此 类 软件 的 总 体 结构 。 


4.4.1 因特网 软件 的 分 层 方法 
加 络 软件 的 首要 任务 是 提供 从 一 台 机 器 到 另 一 台 机 器 传输 报 文 所 需 的 基础 设施 . 在 因特网 ， 





司 已 被 Adobe 公 司 收 购 。 


181 


116 ”和 蔓 4 章 组 网 及 因特网 


报 文 传递 活动 是 通过 软件 单元 的 层次 结构 来 完成 的 ， 这 和 你 把 一 份 礼物 从 美国 的 西海 旦 邮寄 到 
东海 岸 的 过 程 类 似 ( 见 图 4-12)。 第 一 步 , 把 礼物 打包 并 在 包 训 外 面 写 上 正确 的 邮寄 地 址 , 接 者 ， 
把 包 囊 拿 到 运输 公司 ， 例 如 ， 邮 局 ; 运输 公司 把 这 个 包 训 和 其 他 包 圳 一 同 放 入 一 个 大 的 集装箱 ， 
并 送 往 与 其 签 有 服务 合同 的 航空 公司 ; 航空 公司 将 集装箱 装 入 飞机 并 运往 目的 城市 ， 也 许 沿 途 
还 要 经 过 中 转 站 。 在 最 后 的 目的 地 ， 航 空 公司 把 集装箱 从 飞机 气 下 ， 然 后 送 往 目 的 地 的 运输 会 
司 。 接 着， 运输 公司 把 你 的 包 台 从 集装箱 取出 并 送 给 收 件 人 。 





源 目的 地 
准备 运送 国 取 出 并 打 
的 包 囊 人 开 包 束 
把 包 囊 放 入 集 装 从 集装箱 取出 包 
箱 交 给 航空 公司 eg 事 送 到 目的 地 址 
到 飞机 上 让 是 到 运输 公司 


将 集 闭 箱 送 到 男 一 架 飞机 
图 4-12 ” 包 囊 运输 的 例子 


简 而 言 之 ， 礼 物 的 运输 过 程 需要 3 层 组 织 : (1) 用 户 层次 〈 包 括 你 和 你 的 朋友 )，(2) 运输 
公司 ，(3) 航空 公司 。 每 一 层 把 下 一 层 当 作 抽 象 工具 来 使 用 。( 我 们 不 关心 运输 公司 的 工作 细节 ， 
而 运输 公司 也 不 需要 关心 航空 公司 的 内 部 运作 。) 组 织 的 每 一 层 在 源 端 和 目的 端 都 有 代理 , 在 目 
的 端的 代理 完成 在 源 端 相应 代理 的 相反 工作 。 

因特网 上 软件 控制 通信 的 过 程 和 运输 包 囊 的 情况 类 似 ， 只 是 因特网 上 的 软件 有 4 层 而 不 是 3 
层 , 每 层 所 涉及 的 是 软件 例 程 而 不 是 人 和 企业 。 这 4 层 就 是 众所周知 的 应 用 层 (application layer)、 
传输 层 〈transport ljayer)、 网 络 层 〈network layer)、 链 路 层 〈link layer)〈 图 4-13)7。 通 常 ， 由 应 
用 层 产 生 一 个 报 文 ， 当 这 个 报 文 准备 发 适时 ， 从 应 用 层 网 下 传递 ， 经 由 传输 层 和 网 络 层 ， 最 后 
传递 到 链 路 层 进行 传输 。 目 的 地 的 链 路 层 接 收 这 条 报 文 ， 沿 逆 回 分 层 结构 癌 上 传递 ， 直 到 把 它 
欧 给 目的 地 的 应 用 层 。 


链 路 层 


图 4-13 ”因特网 软件 层次 
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下 面 通过 跟踪 一 个 报 文通 过 网 络 系统 的 路 径 , 从 总 体 上 研究 一 下 报 文 的 传输 过 程 ( 图 4-14)。 
首先 从 应 用 层 开始 。 











图 4-.14 ”因特网 上 报 文 的 传输 过 程 


应 用 层 由 那些 使 用 因特网 通信 来 完成 任务 的 软件 单元 组 成 ， 如 客户 机 和 服务 器 软件 。 虽 然 
名 称 类 似 ， 但 是 这 一 层 不 局 限于 3.2 节 介绍 的 软件 分 类 中 的 应 用 软件 ， 还 包括 一 些 实用 软件 包 。 
例如 ， 使 用 FTP 协议 传输 文件 的 软件 和 利用 安全 外 壳 协 议 SSH) 提供 远程 访问 功能 的 软件 已 
经 很 普遍 ， 所 以 通常 称 它们 为 实用 软件 。 

在 因特网 上 ， 应 用 层 使 用 传输 层 发 送 和 接收 报 文 的 方式 与 我 们 通过 运输 公司 邮寄 和 接收 包 
庄 非 常 相 似 。 正 像 我 们 有 责任 提供 一 个 和 运输 公司 所 要 求 的 规范 一 致 的 地 址 一 样 ， 应 用 层 负责 
向 因特网 基础 设施 提供 兼容 的 地 址 。 为 了 满足 这 个 要 求 ， 应 用 层 利用 因特网 上 的 名 字 服 务 器 提 
供 的 服务 来 把 便于 人 类 记忆 的 地 址 翻译 成 符合 因特网 规范 的 耳 地址 。 

传输 层 的 重要 任务 是 从 应 用 层 接收 报 文 并 确保 报 文 以 正确 的 格式 在 因特网 上 传输 。 为 了 第 
二 个 目的 ， 传 输 层 将 长 报 文 分 成 小 的 片段 作为 在 因特网 上 传输 的 独立 单位 。 由 于 在 因特网 内 一 
个 长 报 文 会 阻塞 许多 报 文 必 经 的 结 点 ， 所 以 对 长 报 文 的 分 段 是 必需 的 。 实 际 上 ， 小 段 的 报 文 在 
这 些 结 点 可 以 交叉 通过 ， 而 一 个 长 报 文 在 经 过 这 些 结 点 时 将 迫使 其 他 报 文 等 待 〈 很 像 在 铁路 交 
又 道口 ， 许 多 小 汽车 等 一 列 长 火车 通过 的 情况 )。 

传输 层 在 生成 的 小 片段 上 增加 序列 号 ， 从 而 使 这 些 片段 在 报 文 的 目的 地 可 以 重新 组 合 。 然 


后 为 每 个 片段 添加 目的 地 址 ， 并 把 这 些 编 好 地 址 的 、 称 为 分 组 packet) 的 片段 交 给 网 络 层 。 从 
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这 一 刻 开 始 ， 这 些 分 组 被 认为 是 独立 的 、 彼 此 无 关 的 报 文 ， 直 到 它们 到 达 它 们 最 终 目 的 地 的 传 
输 层 。 这 些 属于 同一 个 长 报 文 的 分 组 很 有 可 能 沿 着 不 同 的 路 径 在 因特网 中 传输 。 

在 因特网 的 传输 路 径 的 每 个 步骤 上 决定 分 组 的 下 一 个 发 送 方向 ， 这 是 网 络 层 的 任务 。 事 实 
上 ， 网 络 计 和 其 下 层 的 链 路 层 的 组 合 构成 了 驻 留 在 因特网 路 由 器 上 的 软件 。 网 络 层 负责 维护 路 
由 器 的 转发 表 并 使 用 此 表决 定 分 组 的 转发 方向 。 路 由 器 中 的 链 路 层 负责 接收 和 传输 分 组 。 

这 梓 ， 当 分 组 发 源 地 的 网 络 层 接收 来 自传 输 层 的 分 组 时 ， 它 使 用 其 转发 表 来 决定 分 组 应 该 
被 发 送 到 哪里 ， 并 在 那里 开始 它 的 旅程 。 决 定好 合适 的 方向 后 ， 网 络 层 把 分 组 交 给 链 路 层 ， 进 
行 实际 传输 。 

链 路 层 具 有 传输 分 组 的 职责 。 因 此 ， 链 路 层 必 须要 处 理 目 的 计算 机 所 在 的 个 体 网 络 的 特有 
的 通信 细节 。 人 例如， 如果 网 络 是 以 太 网 ， 链 路 层 将 使 用 CSMA/CD 协 议 ; 如 果 网 络 是 WiFi 网 ， 链 
路 层 将 使 用 CSMA/VCA 协 议 。 

当 分 组 被 传输 后 ， 它 被 处 在 连接 另 一 端的 链 路 层 接 收 到 。 在 那里 链 路 层 把 分 组 向 上 交 给 网 
络 技 ， 由 网 络 层 把 分 组 的 最 终 目的 地 和 网 络 层 的 转发 表 进行 比 对 ， 决 定 分 组 下 一 步 的 方向 。 当 
作出 这 个 决定 后 ， 网 络 层 把 分 组 返回 给 链 路 层 ， 分 组 沿 着 它 的 路 径 被 转发 。 使 用 这 样 的 方式 ， 
分 组 从 一 台 机 器 跳 到 另 一 台 机 器 ， 最 终 到 达 它 的 目的 地 。 

在 这 个 旅程 中 ， 只 涉及 中 转 站 的 链 路 层 和 网 络 层 〈 再 次 参见 图 4-14)。 正 如 前 面 提 及 的 ， 只 
有 这 两 个 层 显示 在 路 由 器 上 。 而 且 ， 为 了 最 小 化 在 每 个 中 转 站 上 的 延迟 时 间 ， 路 由 器 中 的 网 络 
层 转 发 角色 是 紧密 地 与 链 路 层 集 成 在 一 起 的 。 这 样 ， 现 代 路 由 器 转发 一 个 分 组 所 需 的 时 间 是 用 
微 种 来 衡量 的 。 

在 分 组 的 最 终 目 的 地 ， 是 网 络 层 识 别 出 分 组 的 旅程 已 经 完成 。 在 这 种 情况 下 ， 网 络 层 把 分 
组 交 给 它 的 传输 层 ， 而 不 是 转发 它 。 当 传输 层 从 网 络 层 接收 这 个 分 组 时 ， 它 提取 组 成 报 文 的 基 
本 片段 ， 并 按照 报 文 源 端 传输 层 所 提供 的 片段 序列 号 重组 原始 的 报 文 。 一 旦 报 文 重组 了 ， 传 输 
层 碘 把 它 交 给 应 用 层 的 适当 单元 一 一 这 样 便 完成 了 报 文 的 传输 过 程 。 

确定 应 用 层 内 哪个 单元 来 接收 到 来 的 报 文 是 传输 层 的 一 个 重要 任务 ， 这 个 任务 由 为 每 个 单 
元 分 配 的 唯一 端口 号 (port number) (与 第 2 章 讨 论 的 IO 端口 无 关 ) 来 控制 ， 传 输 层 在 报 文 开 
始 它 的 传输 旅程 之 前 要 把 适当 的 端口 号 附加 到 报 文 地 址 上 。 然 后 ， 一 旦 目的 地 的 传输 层 收 到 
了 报 文 ， 它 只 将 报 文 交 给 指定 端口 号 上 的 应 用 层 软件 。 

因特网 用 户 很 少 需要 关心 端口 号 ， 因 为 对 于 普通 的 应 用 有 普遍 接受 的 端口 号 。 例 如 ， 如 果 
请 求 万 维 网 浏览 器 检索 URL 为 http://www.zoo.org/animalsy/frog.html 的 文件 , 那么 浏览 
器 认为 要 通过 80 端 口 和 www.zoo.crg 的 HTTP 服 务 器 联系 。 同 样 ， 当 传输 文件 时 ，FTP 客 户 机 认 
为 应 当 通 过 20 和 21 端 口 与 FTP 服 务 器 通信 。 

概括 地 说 ， 因 特 网 上 的 通信 涉及 软件 的 4 层 的 相互 作用 。 应 用 屋 以 应 用 的 观点 处 理 报 文 ， 传 
输 层 把 报 文 转换 成 适合 因特网 的 段 ， 同 时 将 接收 到 的 报 文 重组 好 后 交 给 适当 的 应 用 程序 ， 网 络 层 
处 理 段 通过 因特网 的 方向 ， 链 路 层 处 理 段 从 一 个 机 器 到 另 一 个 机 器 的 实际 传输 。 另 人 惊讶 的 是 ， 
虽然 有 这 人 么 多 的 工作 ， 因 特 网 的 响应 时 间 却 是 以 毫秒 记 的 ， 所 以 许多 事务 看 起 来 是 瞬间 发 生 的 。 


4.4.2 TCP/IP 协议 往 


由 于 需要 开放 式 网 络 ， 所 以 需要 颁布 一 些 标准 ， 通 过 这 些 标准 ， 不 同 制造 商 生产 的 设备 和 
软件 可 以 和 其 他 厂商 的 产品 一 起 正常 运行 。 其 中 已 产生 的 一 个 标准 是 由 国际 标准 化 组 织 制 定 的 
开放 系统 互 连 〈Open System Interconnection，OSI) 参考 模型 。 与 我 们 刚刚 描述 的 4 层 结构 不 同 ， 
OSI 标准 是 基于 7 层 结构 。 因 为 它 代 表 国 际 组 织 的 权威 ， 所 以 它 经 常 被 引用 ， 但 是 它 已 经 很 难 取 
代 4 层 结构 的 观点 ， 这 主要 是 因为 ，4 层 结构 在 OSI 模型 制定 之 前 已 经 成 为 因特网 的 事实 标准 。 
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TCPP 协 议和 全 是 因特网 所 使 用 的 协议 的 集合 , 这 个 协议 集 用 来 实现 因特网 的 4 层 通信 层次 结 
构 。 实际 上 ， 传 输 控制 协议 (Transmission Control Protocol，TCP) 和 网 际 协 议 (Internet Protocol， 
正 ) 丛生 这 小 庞 大 集合 中 两 个 协议 的 名 字 一 一 因此 把 这 个 协议 集 含 称 为 TCP/IP 协 议 艇 容易 产生 
误解。 更 确切 地 说 ，TCP 定 义 了 传输 层 的 一 个 版 本 ， 这 里 说 版 本 是 因为 在 TCP/IP 协 议 艇 不 只 提 
供 一 个 传输 层 实现 方式 ， 另 一 个 版 本 是 用 户 数据 报 协议 〈User Datagram Protocol，UDP)。 传 输 
层 采 用 两 种 协议 的 情况 和 运输 包 囊 的 过 程 类 似 ， 你 可 以 选择 不 同 的 运输 公司 ， 每 个 公司 提供 相 
同 的 基本 服务 ， 但 每 个 又 都 有 自己 的 特点 。 因 此 ， 根 据 特 定 的 服务 质量 的 要 求 ， 应 用 层 的 软件 
单元 可 以 选择 通过 传输 层 的 TCP 还 是 通过 UDP 版 本 来 传输 数据 《图 4-15)。 

应 用 层 





传输 层 本 
TCP UDP 

比较 “可靠 " 但， 比较 高 效 但 

不 太 高 效 不 太 “ 坷 系 


图 4-15 _TCP 和 UDP 之 间 的 选择 


TCF 和 UDP 之 间 有 一 些 基本 的 差别 。 第 一 个 区 别 是 ， 基 于 TCP 协 议 的 传输 层 发 送 应 用 层 所 
请 求 的 报 文 前 ， 先 要 向 目的 地 的 传输 层 发 送 一 个 自己 的 请 求 报 文 来 告诉 目的 地 有 报 文 要 发 送 . 
然后 ， 传 输 层 在 发 送 应 用 层 的 报 文 前 ， 等 待 目的 地 确认 这 个 报 文 。 按 照 这 个 方式 ， 我 们 说 基于 
TCP 的 传输 层 在 发 送 报 文 前 建立 了 一 个 连接 。 基 于 UDP 的 传输 层 在 发 送 一 个 报 文 前 不 建立 这 样 
的 连接 ， 它 仅仅 按照 所 给 的 地 址 发 送 报 文 ， 然 后 就 忘记 这 个 报 文 ， 尽 管 它 知道 目的 地 的 计算 机 
甚 全 可 能 是 不 运转 的 。 由 于 这 个 原因 ，UDP 被 称 为 无 连接 协议 。 

ITCP 和 UDP 之 间 的 第 二 个 差别 是 ，TCP 传 输 层 的 源 和 目的 地 通过 确认 和 分 组 重 发 的 方式 来 
共同 确保 一 个 报 文 的 所 有 片段 都 被 成 功 地 传输 到 目的 地 。TCP 被 称 为 可 靠 的 协议 ， 而 UDP 不 提 
供 这 种 重 发 服务 ， 被 称 为 不 可 靠 的 协议 。 

ITCP 和 UDP 之 间 还 有 另外 一 个 区 别 ， 那 就 是 TCP 提 供 了 流量 控制 〈flow control)〔 意 思 是 报 
文 源 反 的 TCP 传 输 层 能 降低 它 发 送 数据 段 的 速率 ， 防 止 TCP 发 送 方向 网 络 传 入 大 量 的 突 发 数据 
造成 网 络 阻塞 ) 和 拥塞 控制 〈congestion control) 《意思 是 报 文 源 点 的 TCP 传 输 层 能 调整 它 的 发 
运 速率 ， 缓 和 它 与 报 文 目的 地 间 的 拥塞 )。 

这 并 个 意味 UDP 是 一 个 不 好 的 协议 ， 要 知道 ， 基 于 UDP 的 传输 层 比 基 于 TCP 的 更 简单 。 因 
此 ， 如 有 果 一 个 应 用 准备 涉及 UDP 的 潜在 特点 ， 那 么 基于 UDP 的 传输 层 会 是 更 好 的 选择 。 例 如 ， 
UDP 的 高 效 使 得 它 成 为 DNS 查找 和 VoIP 选择 的 协议 。 但 是 ， 因 为 电子 邮件 是 较 少 时 间 教 感 的 ， 
所 以 邮件 服务 器 使 用 TCP 传 输电 子 邮 件 。 

正 是 实现 赋予 网 络 层 任务 的 因特网 标准 。 我 们 注意 到 这 个 任务 包括 转发 〈forwarding) (这 
涉及 通过 因特网 的 分 组 的 中 继 ) 和 路 由 (routing) (这 涉及 更 新 层 的 转发 表 ， 以 反映 出 条 件 的 改 
变 )。 例 如 ， 一 个 路 由 器 可 能 会 出 现 故障 〈 意 味 着 这 个 方向 上 的 信息 不 能 再 向 前 传输 ) 或 因特网 
的 一 个 区 域 可 能 变 得 拥堵 (意味 着 信息 的 传输 应 该 绕 过 这 个 区 域 )。 当 和 饭 们 变换 路 由 信息 时 ， 与 
路 由 有 关 的 下 标准 大 多 数 是 处 理 用 来 进行 相 邻 网 络 层 间 的 通信 协议 的 。 

与 转发 有 关 的 一 个 有 趣 的 特性 是 ; 在 信息 的 源头 下层 每 一 次 准备 数据 包 时 ， 它 都 把 一 个 称 
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之 为 跳 数 的 值 〈 或 生存 的 时 间 ) 加 到 数据 包 上 。 当 数据 包 试图 找到 它 穿 越 因 特 网 的 路 径 时 ， 这 
个 值 限制 了 数据 包办 责 转 发 的 次 数 。 正 层 每 次 向 前 转发 一 个 数据 包 ， 它 将 把 这 个 数据 包 的 跳 数 
减 1。 通 过 这 个 信息 ， 网 络 层 能 保护 因特网 ， 以 免 数 据 包 在 系统 内 无 休止 地 循环 。 昌 然 因 特 网 的 
规模 每 天 都 在 增长 ， 但 初始 的 64 跳 数 仍然 足以 让 数据 包 在 当今 ISP 的 路 由 器 迷宫 中 找到 它 自 己 的 路 。 
多 年 以 来 ， 称 为 JPv4《〈 版 本 为 4 的 下 ) 的 耻 版 本 一 直 在 因特网 内 实现 网 络 层 的 功能 。 然 而 ， 
因特网 迅速 超出 了 IPv4 所 规定 的 32 位 网 络 地 址 体系 ， 因 此 建立 了 一 个 新 的 称 为 ITPv6 的 了 P 版 本 ， 
它 使 用 128 位 的 网 络 地 址 。 目 前 ，IPv4 正 在 向 IPv6 过 渡 。(4.2 节 中 介绍 因特网 地 址 的 部 分 间接 提 到 
过 这 个 过 渡 。) 某 些 地 区 实际 上 已 经 使 用 IPv6， 而 在 其 他 地 区 这 个 过 渡 还 要 持续 几 年 。 例 如 ， 美 国 
政府 计划 到 2008 年 完成 向 IPv6 的 转变 。 无 论 如 何 ， 因 特 网 的 32 位 地 址 预计 要 到 2025 年 才 会 过 时 。 


问题 与 练习 

1. 因特网 软件 层次 结构 的 哪些 层 用 在 路 由 器 上 ? 

2. 基于 TCP 协 议 的 传输 屋 和 基于 UDP 协议 的 传输 屋 之 间 有 哪些 区 别 ? 
3. 因特网 软件 如 何 确 保 不 会 有 报 文 在 因特网 内 无 休止 地 中 继 ? 

4. 怎样 阻止 因特网 上 的 计算 机 记录 所 有 途经 它 的 报 文 的 副本 ? 


Ra HP 


当 一 台 计 算 机 连接 到 网 络 上 时 ， 它 会 遭受 到 未 授权 用 户 的 访问 和 恶意 破坏 。 本 节 讨 论 和 这 
蔡 内 容 有 关 的 话题 。 


4.5.1 入侵 的 形式 


通过 网 络 连接 侵 稚 计算 机 系统 以 及 其 所 存储 的 资源 有 很 多 种 方法 ， 大 多 数 方法 包括 恶意 软 
件 的 使 用 〈 统 称 恶 意 软 件 (malware))。 这 类 软件 可 以 在 计算 机 自身 扩散 和 运行 ， 也 可 以 侵袭 远 
曰 离 的 计算 机 。 病 毒 、 蠕 虫 、 特 洛 伊 木 马 和 间谍 软件 都 是 以 入 侵 的 方式 在 计算 机 中 扩散 和 运行 
的 恶意 软件 ， 这 些 名 称 反 映 了 软件 的 主要 特征 。 


计算 机 应 急 响 应 小 组 


1988 年 11 月 ， 发 布 到 因特网 上 的 一 个 蠕虫 病毒 造成 了 网 络 服务 的 严重 瘫 猎 。 随 后 ， 美 国 
国防 商 级 研究 计划 团 (DARPA ) 成 立 了 计算 机 应 急 响 应 小 组 (Compater Energency Response 
Team，CERT )， 并 设立 在 卡 内 基 - 梅 隆 大 学 内 的 CERT 协 调 中 心 ，CERT 是 困 特 网 旺 全 的 “ 监 
督 者 "。 其 职责 是 安全 问题 的 调查 、 发 布 安全 警告 和 发 起 提高 公众 的 因特网 安全 意识 的 运动 。 
CERT 协 调 中 心 的 网 站 为 httDp:y/www.cert.org， 上 面 有 其 活动 的 公告 . 


病毒 (virus) 是 这 样 一 种 软件 ， 首 先 它 通 过 将 自身 赔 入 到 计算 机 已 有 的 程序 来 感染 计算 机 。 
接着 ， 当 “宿主 ”程序 运行 时 ， 病 毒 也 运行 。 当 运行 时 ， 许 多 病毒 不 仅仅 把 自身 扩散 到 计算 机 
中 的 其 他 程序 ， 一 些 病毒 还 做 破坏 性 的 动作 。 例 如 ， 使 操作 系统 的 部 分 性 能 下 降 ， 删 除 海量 存 
储 器 的 重要 模块 ， 或 者 毁坏 数据 和 其 他 程序 。 

蠕虫 worm) 是 有 自主 能 力 的 程序 ， 它 可 以 通过 网 络 传播 ， 占 据 计 算 机 的 存储 空间 并 通过 
复制 扩散 到 其 他 计算 机 。 和 病毒 的 情况 一 样 , 蠕虫 只 是 用 来 复制 自身 或 实施 较 严 重 的 破坏 行为 ， 
螨虫 破 坏 的 一 个 典型 后 果 是 ， 由 于 蠕虫 副本 的 激增 使 合法 程序 的 性 能 下 降 ， 最 终 整 个 网 络 或 因 
特 网 因为 负载 过 重 而 次 痪 。 


4.5 安全 性 121 


特洛伊 木马 〈Trojan horse) 是 一 种 伪装 成 合法 程序 〈 比 如 游戏 或 有 用 的 插件 ) 进入 计算 机 
系统 的 软件 ， 它 们 被 受害 者 自愿 引入 。 然 而， 一 旦 特洛伊 木马 程序 进入 计算 机 ， 它 就 会 实施 额 
外 的 破坏 作用 。 这 些 额外 的 作用 ， 有 时 是 立即 发 生 ， 而 有 时 ， 特 洛 伊 木 马 可 能 暂时 处 于 体 虐 ， 
直到 被 一 个 特殊 的 事件 激活 ， 如 一 个 预定 日 期 的 到 来 。 特 阁 伊 木马 和 篆 以 有 诱惑 力 的 电子 邮件 
附件 的 形式 出 现 ， 当 这 类 附件 被 打开 《确切 地 说 是 接收 邮件 者 请 求 浏览 附件 ) 时 ， 它 的 破坏 活 
动 就 开始 了 。 所 以 次 不 要 打开 来 源 不 明 的 邮件 附件 。 

亚 意 软件 的 另 一 种 形式 是 间谍 软件 (spyware) (有 时 称 为 嗅 探 〈sniffing) 软件 )， 这 类 软 
件 收 集 它 所 驻 留 计算 机 的 活动 信息 ， 并 把 这 些 信息 报告 给 攻击 的 上 发 起 者 。 有 的 会 司 使 用 间谍 
软件 来 建立 销 费 者 的 档案 ， 这 种 情况 下 ， 章 到 质疑 的 是 它 是 否 违 背 道 德 。 而 对 于 其 他 情况 ， 
使 用 间谍 软件 的 目的 就 是 用 来 破坏 的 ， 比 如 通过 记录 计算 机 键盘 的 打字 序列， 来 寻找 密码 或 
信用 卡 卡 与 。 

间谍 软件 通过 秘密 嗅 探 方式 获取 信息 ， 与 此 相反 ， 电 子 黑 饵 (phishing) 技术 是 简单 直接 地 
索要 信息 。 由 于 电子 墨 饵 的 诈骗 过 程 是 同 网 络 中 撒 大 量 的 “ 线 ” 来 等 待 某 些 人 上 钩 ， 所 以 电子 
黑 饵 术语 是 钓鱼 的 双关 语 "。 电 子 黑 饵 通常 用 电子 邮件 来 实施 , 这 与 用 老式 电话 进行 诈 骗 没有 差 
别 。 诈 骗 犯 以 金融 机 构 、 政 府 机 关 或 者 执法 机 构 的 名 义 发 送 邮 件 信息 ， 这 类 邮件 加 可 能 的 受害 
者 索要 假 效 用 于 合法 目的 的 信息 ， 和 而 实际 上 ， 这 上 奉 依 息 被 诈 允 犯 恶意 使 用 。 

与 遭受 病毒 和 全 谍 软 件 等 内 部 传染 人 不同， 计算 机 还 能 够 租 网 络 系统 中 其 他 计算 机 所 运行 的 
软件 攻击 。 拒 绝 服 务 (denial of service，DOS) 攻击 就 是 其 中 的 一 个 例子 ， 这 个 程序 使 得 计算 机 
有 超 负 荷 的 要 求 回复 的 信息 。 拒 绝 服务 攻击 已 经 向 因特网 的 大 型 商业 万 维 网 服务 器 发 起 攻击 ， 
从 而 破坏 公司 的 业务 ， 在 某 些 情况 下 ， 拒 绝 服务 攻击 导致 公司 的 商业 活动 中 断 。 

拒绝 服务 攻击 要 求 在 短暂 的 时 间 内 产生 大 量 的 要 求 回复 的 信息 ， 为 了 达到 这 个 目的 ， 攻 击 
者 通常 在 大 量 未 设防 的 计算 机 内 植 入 攻击 软件 ， 只 要 给 一 个 信号 ， 攻 击 软 件 就 会 产生 要 求 回复 
的 信息 。 接 着 ， 一 旦 信号 发 出 ， 所 有 这 些 计 算 机 就 用 要 求 回 复 的 信息 将 目标 计算 机 淹没 。 因 而 ， 
拒绝 服务 攻击 的 实质 是 把 未 设防 的 计算 机 作为 帮凶 来 使 用 。 这 就 是 为 什么 双 阻 所 有 的 PC 用 户 ， 
在 不 使 用 因特网 时 断 开 网 络 。 据 估计 ，PC 一 旦 连接 到 因特网 ，20 分 钟 内 就 至 少 有 一 个 入 侵 者 会 
充分 利用 它 。 因 此 ， 未 设防 的 PC 严重 威胁 因特网 的 安全 性 。 

另 一 个 和 无 用 信息 有 关 的 问题 是 无 用 垃 明 邮 件 的 散布 ， 称 为 垃圾 邮件 〈spam)。 和 拒绝 服 
务 攻 击 不 同 的 是 ， 二 最 邮件 的 数量 不 足以 控制 计算 机 系统 。 但 是 ， 垃 圾 邮件 的 作用 是 控制 接收 
二 援 邮件 的 人 。 正 如 我 们 所 看 到 的 ， 问 题 已 经 被 这 样 的 事实 扩大 了 ， 垃 圾 邮件 大 量 被 用 作 电 子 
黑 饵 和 特洛伊 木马 传播 病毒 及 其 他 恶意 软件 的 媒介 。 


4.5.2 ”防护 和 对 针 


毫 无 疑问 ,“ 防 串 于 未 然 ” 道 出 了 控制 网 络 连接 上 和 亚 意 破坏 情况 的 真理 。 一 个 主要 的 技术 是 
过 滤 穿 过 网 络 某 一 重要 结 点 的 通信 流 ， 通 常 是 用 称 为 防火 墙 (firewall) 的 软件 。 例 如 ， 防 火 墙 
可 能 安 朔 在 组 织 内 联网 的 网 基 处 来 过 滤 进 出 区 域 的 信息 。 这 种 防火 墙 设 计 的 目的 是 ， 阻 止 对 其 
些 特定 目的 地 址 的 信息 的 发 送 以 及 阻止 接受 已 知 的 有 问题 的 来 源 所 发 送 的 信息 。 后 一 种 功能 可 
以 作为 终止 拒绝 服务 攻击 的 工具 ， 因 为 它 提供 了 阻止 来 自 具 有 攻击 性 计算 机 的 通信 量 。 安 装 在 
网 关 处 的 防火 圾 扮 污 的 另 一 个 角色 是 ， 阻 止 所 有 源 地 址 为 通过 该 网 关 访 问 的 区 域内 地 址 的 输入 
信息 ， 因 为 这 样 的 信息 表明 有 外 人 假装 区 域内 成 员 。 众 所 周知 ， 把 自己 伪装 成 其 他 的 成 员 是 欺 
骗 (spoofing )。 





人 phishing 与 fshing 的 发 音 相 同 。 详 者 注 
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防 兴 场 不 但 能 保护 整个 网 络 或 域 ， 更 能 用 于 保护 个 人 计算 机 。 例 如 ， 如 果 一 台 计 算 机 不 用 
作 万 维 网 服务 器 、 域 名 服务 器 或 邮件 服务 器 ， 那 么 安装 在 这 人 台 计 算 机 上 的 防火 墙 应 当 阻 止 所 有 
用 于 这 些 应 用 的 通信 。 实 际 上 ， 入 侵 者 获得 计算 机 人 入口 的 一 个 途径 就 是 通过 一 个 已 经 不 存在 的 
服务 器 历 留 下 的 “漏洞 ”来 建立 联系 。 尤 其 是 ， 利 用 间谍 软件 取 回 信息 的 方法 就 是 在 感染 的 计 
算 机 上 建立 一 个 秘密 的 服务 器 ， 通 过 这 个 服务 器 恶意 客户 取 回 间谍 软件 的 嗅 探 结果 。 正 确 安装 
防火 墙 可 以 阻止 这 类 恶意 客户 的 报 文 。 

还 有 些 防 火 增 的 变种 是 为 一 些 特殊 目的 设计 的 ， 垃 圾 邮件 过 滤器 (spam filters) 就 是 其 中 
一 例 ， 设 计 这 种 防火 墙 是 为 了 阻止 一 些 垃圾 邮件 。 许 多 垃圾 邮件 过 滤器 在 区 分 所 需 的 正常 邮件 
和 二 蕉 邮件 这 个 问题 上 ， 采 用 的 是 一 种 较为 复杂 的 技术 。 一 些 过 滤器 通过 一 个 训练 式 的 过 程 来 
学 会 做 出 这 种 区 分 判断 。 在 这 个 过 程 中 ， 用 户 确定 垃圾 邮件 的 条 目 ， 直 到 过 滤器 获得 了 足够 多 
的 例子 来 自己 做 出 判断 为 止 。 如 何 将 各 种 不 同 的 学 科 领 域 ( 如 概率 论 、 人 工 智 能 等 ) 连接 起 来 ， 
共同 推动 其 他 领域 的 发 展 ， 这 些 过 滤器 就 是 例子 。 

发 一 种 防护 工具 已 经 滤 去 了 它 的 涵义 ， 它 就 是 代理 服务 器 。 代 理 服务 器 (proxy server) 是 
一 个 软件 单元 ， 它 作为 客户 机 和 服务 器 之 间 的 媒介 ， 其 目标 是 保护 客户 机 屏蔽 来 自 服 务 器 的 不 
利 行 为 。 如 果 不 用 代理 服务 器 ， 客 户 机 就 直接 与 服务 器 通信 ， 这 就 意味 着 服务 器 有 机 会 获得 客 
户 机 的 一 定数 量 的 信息 。 随 着 时 间 的 推移 ， 同 一 个 组 织 的 内 联网 内 的 许多 客户 机 都 与 远 处 的 服 
务 璐 通信， 这 样 一 来 ， 该 服务 器 就 能 收集 大 量 的 关于 内 联网 内 部 结构 的 信息 ， 而 这 些 信 息 在 以 
后 可 被 用 于 怀 有 恶意 的 活动 。 为 了 防范 这 一 点 ， 组 织 可 以 建立 一 个 代理 服务 器 ， 用 作 特 定 种 类 
的 服务 〈 如 FTP、HITP 和 telnet 服 务 等 )， 于 是 ， 每 次 域内 的 客户 机 试图 连接 某 个 类 型 的 服务 器 
时 ， 客 尸 机 实际 上 连接 的 是 代理 服务 器 。 于 是 代理 服务 器 扮演 了 客户 机 的 角色 与 实际 的 服务 器 
相连 。 从 这 时 候 开 始 ， 代 理 服务 器 就 扮演 了 实际 的 客户 机 与 实际 的 服务 器 之 间 的 媒介 的 角色 ， 


来 回 地 中 转 报 文 。 这 种 设置 的 第 一 个 好 处 就 在 于 实际 的 服务 器 没 办 法 知道 ， 代 理 服务 器 不 是 丰 


的 客户 机 ， 事 实 上 ， 它 永远 不 会 意识 到 实际 的 客户 机 的 存在 。 这 样 一 来 ， 实 际 的 服务 器 就 没有 
办 法 了 解 域 的 内 部 特性 。 第 二 个 好 处 在 于 代理 服务 器 能 够 起 到 过 滤 所 有 服务 器 发 往 客户 机 的 报 
文 的 作用 。 例 如 ，FTP 代 理 服 务 器 能 够 检查 所 有 的 进入 文件 ， 看 是 否 感 当 了 当前 已 知 的 病毒 ， 
然后 阻止 所 有 感染 过 病毒 的 文件 进入 。 

还 有 另 一 种 用 于 防止 网 络 环境 中 的 问题 的 工具 是 审计 软件 。 它 类 似 于 我 们 在 操作 系统 安全 
门 题 中 所 讨论 的 审计 软件 〈 见 3.5 节 )。 通 过 使 用 网 络 审计 软件 ， 系 统管 理 员 能 够 察觉 到 管理 员 
的 管理 范围 中 不 同位 置 出 现 的 突然 增加 的 报 文 流量 ， 监 控 系 统 防 火 墙 的 活动 状态 ， 并 且 可 以 对 
个 人 计算 机 的 访问 模式 进行 分 析 , 用 以 探测 网 内 的 非 正常 行为 。 审 计 软件 是 管理 员 首 选 的 工具 ， 
用 于 在 出 现 的 问题 超出 其 控制 范围 之 前 ， 对 其 进行 有 效 的 识别 ， 

万 一 种 用 于 防护 通过 网 络 连接 进行 的 入 侵 行为 的 方法 就 是 采用 防 病毒 软件 〈antivirus 
software)。 这 种 软件 用 来 探测 和 删除 通过 已 知 病毒 感染 和 其 他 方式 感染 的 文件 。( 实 际 上 ， 防 病 
毒 软 件 代表 了 软件 产品 中 的 一 个 很 广泛 的 类 别 ， 每 一 类 都 设计 成 探测 和 删除 某 一 特定 类 型 的 感 
染 。 例 如 ， 许 多 产品 专门 研究 对 病毒 的 控制 ， 另 外 一 些 产品 则 专门 研究 对 间谍 软件 的 防范 。 ) 对 
这些 软件 包 的 用 户 而 言 ， 理 解 以 下 内 容 很 重要 ， 正 如 生物 系统 中 的 情况 ， 新 的 计算 机 病毒 感染 
不断 地 出 现 ， 因 而 需要 更 新 疫苗 。 所 以 ， 防 病毒 软件 必须 要 从 软件 提供 商 那里 定期 下 载 更 新 。 
然而 ， 即 使 是 这 样 也 不 能 保证 计算 机 的 安全 。 毕 竟 ， 一 个 新 病毒 在 发 现 和 其 相关 的 疫苗 产生 之 
前 一 定 是 先 感染 了 一 些 计算 机 。 因 此 ， 明 智 的 计算 机 用 户 决 不 会 打开 一 个 不 熟悉 来 源 的 邮件 中 
的 附件 ， 也 不 会 在 没有 确认 软件 的 可 靠 性 之 前 下 载 该 软件 ， 不 会 回复 弹出 广告 ， 在 PC 设 有 必要 
连接 在 因特网 上 时 ， 是 不 会 将 其 连接 上 因特网 的 。 
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也 许 在 因特网 上 使 用 的 最 流行 的 公 铀 加 密 系统 是 基于 RSA 算 法 的 ， 该 算法 的 名 字 来 源 于 
算法 的 创立 者 Ron Rivest、Adi Shamir 和 Len Adleman， 对 此 我 们 将 在 第 11 章 末 进 行 详细 讨论 。 
RSA 技 术 (和 其 他 技术 ) 已 经 用 在 了 PGP 公 司 (PGP 代 表 Pretty Good Privacy ) 开发 的 软件 和 包 
的 集合 中 。 这 些 软 件 包 与 PC 上 使 用 的 大 多 数 邮 件 软件 都 兼容 ， 并 且 个 人 用 户 可 以 免费 获得 ， 
其 非 商业 使 用 可 见 http:y/www.pgp.com。 通 过 使 用 PGP 软 件 ， 个 人 用 户 可 以 产 生 公 令 和 私 
铀 ， 并 用 公 铀 对 报 文 进行 加 密 ， 用 私 铀 对 报 文 进 行 解 密 . 
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在 有 些 情 况 下 ， 网 络 中 恶意 行为 的 目的 是 使 系统 瘫 〈 如 拒绝 服务 攻击 )， 但 是 在 另外 一 些 
情况 下 ， 其 最 终 目 的 是 获取 信息 的 访问 权 。 传 统 的 保护 信息 的 方法 是 通过 使 用 口令 来 控制 对 信 
县 的 访问 。 然 而 ， 当 口令 数据 通过 网 络 和 因特网 传输 时 ， 会 被 一 些 未 知 的 实体 进行 中 转 ， 因而 
其 安全 性 就 会 受到 威胁 ， 因 此 没有 多 大 的 价值 。 在 这 样 的 情况 下 ， 可 以 使 用 加 密 技术 ， 使 得 即 
使 这 些 数据 落 入 不 怀 好 意 的 人 的 手中 ， 编 码 后 的 信息 依然 能 保持 其 机 密 性 。 在 今天 ， 许多 传统 
的 因特网 应 用 已 经 进行 了 改变 ， 并 与 加 密 技 术 相 结合 ， 因而 也 就 产生 了 这 些 应 用 的 所 谓 的 “ 安 
全 版 本 ”。 这样 的 例子 包括 FTPS〈 即 FTP 的 安全 版 本 ) 以 及 SSH (我 们 在 4.2 节 中 介绍 过 ， 它 是 远 
程 登录 服务 的 安全 蔡 代 产品 )。 

还 有 其 他 的 一 些 例子 ， 如 HTTP 的 安全 版 本 ， 称 之 为 HTTPS， 它 用 于 大 多 数 金 融 机 构 中 ， 并 
为 客户 访问 他 们 的 账号 提供 安全 因特网 访问 。HTTPS 的 核心 是 称 为 安全 套 接 字 层 〈Secure 
Sockets Layer，SSL) 的 协议 系统 。 它 最 初 是 由 Netscape 公 司 开 发 的 ， 用 来 为 网 络 中 的 客户 机 和 
服务 器 之 间 提供 安全 的 通信 链 路 。 大 多 数 浏 览 器 是 通过 在 计算 机 屏幕 上 显示 一 个 很 小 的 锁 的 图 
标 来 表明 SSL 的 使 用 。( 有 时 候 会 用 图 标的 出 现 和 不 出 现 来 表示 是 否 正在 使 用 SSL， 其 他 的 可 以 
通过 显示 锁 要 么 处 在 锁 的 状态 ， 要 么 处 在 没有 锁 的 状态 来 表示 。) 

在 加 密 领 域 里 一 个 最 令 人 着 迷 的 话题 就 是 公 钥 加 密 (public-key encryption)。 它 是 一 个 加 密 
系统 ， 在 这 个 系统 中 ， 可 以 知道 是 如 何 对 报 文 进行 加 密 的 ， 但 是 不 允许 知道 如 何 对 报 文 进行 解 
密 。 这 个 特性 看 起 来 好 像 有 些 违 反 直 觉 ， 毕 竟 直 觉 告诉 我 们 ， 如 果 一 个 人 知道 怎样 对 报 文 进 行 
加 密 ， 那 么 他 就 应 该 能 够 反 向 地 对 报 文 进行 解密 。 但 是 ， 当 使 用 公 钥 加 密 技 术 时 ， 这 个 直觉 就 
是 错误 的 。 

会 钥 加 密 系统 涉及 两 个 称 为 密 钥 〈key) 的 值 的 使 用 。 一 个 密 钥 称 为 公 钥 〈public Key)， 用 
来 对 报 文 进行 加 密 ， 另 一 个 密 钥 称 为 私 钥 (private key)， 用 来 对 报 文 进行 解密 。 为 了 使 用 这 个 
系统 ， 首 先 将 公 钥 分 发 给 那些 需要 向 某 个 目的 地 发 送 报 文 的 一 方 ， 而 私 钥 则 在 这 个 目 的 地 端 机 
密 地 保存 。 于是， 初始 报 文 可 以 用 公 钥 进行 加 密 ， 然 后 将 该 报 文 送 往 目 的 地 ， 即使 在 这 期 间 被 
也 知道 公 钥 的 中 间 人 截获 ， 还 能 保证 它 的 内 容 是 安全 的 。 事 实 上 ， 唯一 能 对 报 文 进 行 解密 的 是 
在 报 文 的 目的 地 持 有 私 钥 的 那 一 方 。 这 样 一 来 ， 如 果 Bob 创 建 了 一 个 公 钥 加 密 系 统 ， 并 把 公 铀 
给 Alice 和 Carol 这 两 个 人 ,那么 Alice 和 Carol 这 两 个 人 都 能 对 发 往 Bob 的 报 文 进行 加 密 ， 但 是 他 们 
不 能 够 监听 对 方 的 通信 。 确 实 是 ， 如 果 Carol 截 获 了 来 自 Alice 的 报 文 ， 即使 她 知道 Alice 是 怎样 进 
行 加 密 的 ， 也 不 能 对 该 报 文 进 行 解密 〈 见 图 4-16)。 

当然 ， 公 开 密 钥 系 统 中 存在 一 些小 问题 。 一 个 问题 就 是 要 保证 ， 所用 的 公 钥 事实 上 对 目的 
地 的 那 一 方 而 言 是 一 个 正确 的 密 钥 。 举 例 来 说 ， 如 果 你 正和 银行 在 通信 ， 你 想 确定 这 样 一 个 事 
实 ， 即 你 用 来 加 密 的 公 钥 是 针对 银行 而 言 的 ， 而 不 是 一 个 冒名 顶替 者 。 如 果 一 个 冒名 顶替 者 让 
目 己 以 银行 的 身份 出 现 〈 一 个 有 关 坎 骗 的 例子 )， 并 把 它 的 公 钥 给 你 ， 那么 你 就 会 对 报 文 进 行 加 


之 


093| 


124 第 4 章 组 网 及 因特网 


密 ， 并 发 送 给 “银行 ”， 这 将 对 这 位 冒名 顶替 者 非常 有 意义 ， 而 不 是 银行 。 所 以 ， 将 公 钥 关联 到 
正确 的 另 一 方 的 任务 很 重要 。 


Alice 持 有 公 铀 加 密 报 文 
es Alice 和 Carol 都 能 发 


送 加 密 的 报 文 
加 密 报 文 Bob 持 有 私 外 
Carol 持 有 公 铀 人 一 -一 一 


上 有 国 
ce 持 有 公 铀 和 ne 


本 Bob 持 有 私 铀 Carol 即 使 知道 Alice 
Carol 持 有 公 铜 是 如 何 加 密 的 ， 仍 然 
不 能 解密 Alice 的 报 文 


图 4-16 ” 公 钥 加 蜜 


解决 这 个 问题 的 一 个 办 法 就 是 建立 一 个 可 信任 的 因特网 站 点 ， 称 之 为 认证 机 构 〈certificate 
authority)， 其 任务 是 维护 相关 方 的 准确 列表 以 及 他 们 的 公 钥 。 于 是 ， 这 些 起 着 服务 器 作用 的 认 
证 机 构 为 他 们 的 客户 提供 了 可 靠 的 公 钥 信息 , 这 些 信 息 是 用 称 为 证 书 的 软件 包 的 形式 来 表示 的 。 
证 书 〈certificate) 是 一 个 软件 包 ， 它 包含 有 关 方 的 姓名 和 该 方 的 公 钥 。 现 在 在 因特网 上 有 许多 
商业 认证 机 构 ， 对 这 些 机构 而 言 ， 为 了 更 有 效 地 保持 对 其 通信 安全 性 的 控制 ， 维 护 他 们 自己 的 
证 书 颁 发 也 是 件 比 较 常 见 的 事 。 

最 后 ， 我 们 应 该 在 解决 鉴别 (authentication ) 问题 方面 对 公 钥 加 密 系 统 进 行 一 下 说 明 ， 就 
是 要 确定 : 报 文 的 作者 实际 上 是 他 们 声称 的 那 一 方 。 这 里 关键 的 问题 就 在 于 ， 在 有 些 公 钥 加 密 
系统 中 ， 加 密 密 钥 和 解密 密 钥 的 作用 可 以 转换 。 也 就 是 说 ， 原 文 可 以 由 私 钥 来 加 密 ， 并 且 由 于 
上 只 有 一 方 可 以 访问 这 个 密 钥 ， 因 此 这 样 加密 的 任何 原文 必须 是 从 那 一 方 产生 而 来 的 。 在 这 种 方 
式 下 ， 私 钥 的 持 有 者 就 能 产生 一 个 位 模式 ， 称 之 为 数字 签名 (〈digital signahure)， 只 有 那 一 方才 
知 仍 是 怎么 产生 的 。 通 过 对 报 文 附加 这 样 的 签名 ， 发 送 者 就 能 对 报 文 做 可 以 信任 的 标签 。 数 字 
签名 可 以 和 报 文本 身 的 加 密 形 式 一 样 简单 。 所 有 的 发 送 方 必 须 做 的 事情 就 是 对 要 发 送 的 报 文 用 
自己 的 私 钥 (这 个 密 钥 通常 用 作 解 密 ) 进行 加 密 。 当 接受 方 收 到 报 文 时 ， 就 利用 发 送 方 的 公 铀 
对 这 个 签名 进行 解密 。 这 样 得 出 的 报 文 就 能 保证 其 权威 性 ， 这 是 因为 只 有 私 钥 的 持 有 方才 能 产 

生 该 报 文 的 加 密 形式 。 


4.5.4 ”网络 安全 的 法 律 途径 


必 一 种 增强 计算 机 网 络 系统 安全 性 的 方法 就 是 应 用 法 律 补 救 措施 。 然 而 ， 这 种 方法 有 两 个 
卫 碍 。 第 一 个 障碍 在 于 认定 一 个 行为 不 合法 ， 并 不 意味 着 排除 了 该 行为 。 所 做 的 只 是 提供 了 一 
个 法 律 依靠 而 已 。 第 二 个 障碍 在 于 网 络 的 国际 特性 也 就 意味 着 要 获得 追 索 权 通常 是 很 困难 的 。 
在 一 个 国家 中 不 合法 ， 但 在 另 一 个 国家 却 可 能 是 合法 的 。 最 终 ， 通 过 法 律 途径 来 增强 网 络 安全 
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性 是 一 个 国际 性 的 问题 ， 所 以 必须 由 国际 法 律 机 构 来 处 理 。 一 个 潜在 的 机 构 将 是 位 于 海牙 的 国 
际 法 庭 。 

尽管 法 律 措 施 对 那些 拒绝 承认 者 不 太 有 效 ， 但 我 们 必须 承认 ， 法 律 措施 还 是 有 很 大 影响 力 
的 。 所 以 对 我 们 而 言 ， 在 网 络 领域 里 ， 研 究 用 来 解决 冲突 的 一 些 法 律 步骤 还 是 比较 合适 的 。 为 
此 目的 ， 可 以 用 美国 联邦 法 案 来 作为 例子 进行 说 明 。 还 可 以 从 其 他 一 些 政体 ， 如 欧盟 等 ， 找 到 
类 似 的 例子 。 

首先 讨论 恶意 软件 的 繁殖 问题 。 在 美国 ， 这 个 问题 是 由 计算 机 欺诈 和 滥用 法 (Computer Fraud 
and Abuse Act) 提出 的 ， 该 法 案 于 1984 年 首次 通过 ， 其 后 已 经 做 了 几 次 修改 。 通 过 这 个 法 案 ， 
涉及 蠕虫 和 病毒 的 制造 的 大 多 数 案例 都 已 经 被 起 诉 。 简 而 言 之 ， 这 个 法 案 需 要 证 据 证 明 ， 被 告 
有 意 引起 一 段 程序 或 数据 的 传播 ， 而 这 个 程序 或 数据 具有 明显 的 破坏 意图 。 

计算 机 欺诈 和 涂 用 法 还 包含 涉及 信息 盗窃 的 案例 。 具 体 来 说 ， 这 个 法 案 规 定 ， 通 过 非 授权 
的 方式 访问 计算 机 并 获取 任何 有 价值 的 信息 的 行为 ， 视 为 不 合法 。 法 院 已 经 就 “任何 有 价值 的 ” 
赋予 了 广泛 的 解释 ， 所 以 ， 计 算 机 欺诈 和 滥用 法 已 经 不 仅仅 适用 于 信息 盗窃 的 情况 。 例 如 ， 法 
院 规 定 ， 仅 仅 是 使 用 了 计算 机 就 可 以 算 作 是 “任何 有 价值 的 岂 

在 法 律 界 ， 隐 私 权 是 另 一 个 也 许 是 最 富有 争议 的 网 络 问题 。 这 样 的 问题 包括 雇主 监视 员工 
通信 的 权利 ， 以 及 因特网 服务 提供 商 在 多 大 程度 上 有 权 访 问 正 被 其 客户 通信 的 信息 ， 这 些 问题 
已 经 得 到 了 相当 多 的 关注 。 在 美国 , 这 些 问题 有 许多 已 经 在 1986 的 电子 通信 隐私 法 案 (Electronic 
Comrmunication Privacy Act，ECPA) 中 提 到 ， 这 个 法 案 起 初 是 为 控制 搭 线 监听 而 设立 的 。 虽 然 
法 案 很 长 ， 但 是 仍 能 从 几 段 短 的 摘录 中 捕捉 到 它 的 意图 。 具 体 来 说 ， 它 声明 ， 


除了 本 章 中 以 其 他 方式 特别 提 到 的 ， 任 何 有 意 截 获 、 力 图 截取 或 者 唆使 他 人 截取 
或 力图 截取 任何 有 线 、 口 头 或 电子 通信 ,…… 的 人 应 按照 子 条 款 (4) 受到 惩罚 ， 或 者 按 
照 子 条 款 ($) 受到 起 诉 ， 


还 有 


ee 任何 向 公众 提供 电子 通信 服务 的 个 人 或 实体 ， 不 得 在 服务 时 有 意 将 任何 通信 
的 内 容 …… 泄 露 给 除了 这 些 通信 的 收 件 人 或 意 想 的 接收 人 人， 或 者 这 些 收 件 人 或 意 想 的 
接收 人 的 代理 人 之 外 的 任何 人 。 


傈 而 言 之 , ECPA 确 认 了 个 人 秘密 通信 的 权利 ,因特网 服务 提供 商 泄 串 有 关 其 客户 的 通信 信 
县 是 非法 的 ， 并 且 ， 非 授权 用 户 偷 听 他 人 的 通信 是 非法 的 。 但 是 ，ECPA 还 是 留 下 了 一 些 有 争论 
的 地 方 。 例 如 ， 关 于 雇主 监视 雇员 的 通信 的 权利 问题 变 成 了 一 个 授权 问题， 在 这 个 问题 上 ， 当 
雇员 用 的 是 雇主 的 设备 实施 通信 时 ， 法 院 倾 向 于 承认 雇主 。 

而 且 ， 这 个 法 案 在 某 些 条 件 限 制 下 ， 会 给 某 些 政府 部 门 监控 电子 通信 的 权利 。 这 些 已 经 成 
为 了 很 多 争论 的 源头 。 例 如 ， 在 2000 年 ，FBI 揭 露 了 一 个 称 为 Carnivore 的 系统 的 存在 ， 该 系统 能 
显示 一 个 因特网 服务 提供 商 的 所 有 订户 的 通信 信息 ， 而 不 仅仅 是 法 庭 认 可 的 目标 。 在 2001 年 ， 
为 了 回应 针对 世界 贸易 中 心 的 丽 怖 获 击 , 国会 通过 了 富有 争议 的 “美国 爱国 者 法 案 ”"(Uniting and 
strengthening America by Providing Appropriate Tools Required to Intercept and Obstruct Terrorism ， 
USA PAIRIOTJ)， 该 法 案 修 改 了 政府 部 门 所 必须 实行 的 这 些 限制 。 

提供 这 种 监控 权利 除了 引起 了 法 律 和 道德 上 的 争论 外 ， 还 引起 了 与 我 们 的 研究 更 相关 的 一 
至 技术 问题 。 一 个 问题 是 ， 提 供 了 这 些 能 力 ， 通 信 系 统 必 须 进 行 构建 和 编程 ， 使 其 可 以 被 监控 。 
建立 这 样 的 能 力 是 通信 辅助 法 执行 法 案 (Communication Assistance for Law Enforcement Act， 
CALEA) 的 目标 。 它 要 求 电 信 运 营 商 修改 它们 的 设备 以 适应 法 律 强制 监听 。 而 这 个 需求 已 被 证 
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明 比 较 复 梨 ， 而 且 实 现 起 来 昂贵 。 

另 一 个 富有 争议 的 问题 涉及 政府 监控 通信 的 权利 与 公众 使 用 加 密 的 权利 之 间 的 冲突 。 如 果 
正 梓 监 控 的 报 文 加 密 得 很 好 ， 那 么 窃听 通信 对 于 法 律 强制 机 构 来 说 就 没有 多 大 价值 。 美 国 、 加 
拿 大 和 欧洲 各 国政 府 正 在 考虑 需要 注册 加 密 密 钥 的 系统 ,但 是 这 样 的 需求 被 公司 想到 了 。 上 毕竟 ， 
由 于 间谍 组 织 的 原因 ， 可 以 很 容易 理解 要求 注 册 加 密 密 钥 会 使 得 许多 道 守法 律 的 公司 和 个 人 
感到 不 舒服 。 注 册 系 统 的 安全 性 有 多 高 ? 

最 后 ， 作 为 识别 因特网 环境 的 法 律 范畴 内 的 问题 的 一 种 工具 ， 我 们 引用 1999 年 的 反 网 络 域 
名 抢 注 消费 者 保护 法 案 〈the Anticybersquatting Consumer Protection Act)， 设 计 这 个 法 案 是 为 了 
防止 时 名 项 蔡 者 以 别 的 方式 建立 一 个 看 上 去 相似 的 域名 〈 这 个 阴谋 就 称 为 域名 抢 注 ) 来 舱 骗 一 
些 机 构 。 这 个 法 案 禁 止 使 用 与 其 他 商标 或 “民法 商标 ”一 样 的 或 相似 得 容易 引起 混淆 的 域名 。 
一 个 作用 是 ， 尽 管 该 法 案 没 有 将 域名 的 投机 买卖 (就 是 注册 一 个 潜在 的 有 需求 的 域名 ， 以 后 再 
将 该 域名 的 所 有 权 卖 出 的 一 个 过 程 ) 视 为 不 合法 ， 但 是 它 限制 了 对 常用 域名 的 投机 买卖 。 所 以 ， 
域名 的 投机 买卖 者 可 能 能 够 合法 地 注册 一 个 常用 域名 ， 加 GreatUsedcCcars .com， 但 是 如 果 Big 
Al 是 用 在 汽车 商业 上 ， 那 么 他 就 不 可 能 注册 域名 BigalUsedcars .com。 这 种 区 别 经 常会 在 基 
于 反 网 络 域名 抢 注 消费 者 保护 法 案 的 法 律 诉 讼 案 中 成 为 争论 的 主题 。 


问题 过 练习 

.通常 亚 意 软件 获得 计算 机 系统 访问 的 两 种 方法 是 什么 ? 

2. 能 放 在 域 网 关 的 防火 墙 和 放 在 域内 单个 主机 上 的 防火 墙 类 型 之 间 有 什么 差别 ? 

3. 理论 上 说 ,术语 数据 指 信息 的 表现 ， 而 信息 指 基本 的 售 义 。 口 令 用 来 保护 数据 还 是 信息 ? 加 蜜 保护 的 
是 数据 还 是 信息 ? 

4， 和 传统 的 加 蜜 技术 相 比 ， 会 钥 加 密 技 术 的 优势 是 什么 ? 


5. 和 防备 网 络 安全 问题 相关 的 法 律 尝试 有 哪些 ? 


人 生 1 证 王 ， 且 有 基于 革 上 ar sr -mm Te 汪 本 夺 站 打 -EPE 站 而 国语 时 本 是 本 证 -EL- - 柯 呈 司 2Eam 


复习 题 
《 带 * 的 题目 涉及 选读 小 节 的 内 容 。) 样 区 分 ? 
1. 什么 是 协议 ? 说 出 本 章 介 绍 的 3 个 协议 , 并 描 11. 网 络 和 因特网 的 区 别 是 什么 ? 
述 每 个 协议 的 目标 。 12. 说 出 网 络 中 用 来 控制 报 文 发 送 权 的 两 个 协 
2. 指出 并 描述 日 常生 活 所 用 到 的 客户 -服务 器 议 。 
协议 。 13. 使 用 32 位 因特网 地 址 原先 被 认 是 提供 了 足够 
3. 描述 客户 -服务 器 模型 。 大 的 扩展 空间 , 但 这 个 推测 被 证 实 并 不 准确 。 
4. 说 出 计算 机 网 络 的 两 种 分 类 方法 。 IPv6 使 用 128 位 地 址 , 这 个 将 被 证 明 是 足够 的 
5. 开放 式 网 络 和 封闭 式 网 络 之 间 的 区 别 是 什 吗 ? 证 明 你 的 答案 。《【 例 如 ， 你 可 以 把 可 能 
全 了? 的 地 址 数目 与 世界 的 人 口 进 行 比 较 。) 
6. 为 什么 CSMA/MCD 协 议 不 能 应 用 于 无 线 网 14. 用 操 分 十 进 制 记 法 为 下 列 位 模式 编码 。 
络 ? a, 000000010000001000000011 
7. 描述 在 使 用 CSMA/VCD 协 议 的 网 络 内 ,一 台 机 b. 1000000000000000 
器 如 果 要 发 送 报 文 所 要 道 循 的 步骤 。 c. 0001100000001100 
8. 什么 是 隐藏 终端 问题 ? 描述 解决 它 的 技术 。 15. 下 列 点 分 十 进 制 记 法 表示 的 位 模式 分 别 是 什 
9. 集线器 和 中 继 器 怎样 区 分 ? 全 ? 


10. 路 由 器 和 中 继 器 、 网 桥 及 交换 机 这 类 设备 怎 a. 0.0 


复习 题 127 
b. 25.18.1 <htImlL> 
c. 5.12.13.10 <headq> 

16. 假设 因特网 上 一 台 主 机 的 地 址 是 134.48.4. 123， < 七 七 全 > 忆 XBamD1e</t1Lt1e> 
那么 这 个 32 位 地 址 如 何 用 十 六 进 制 记 法 表 区 
一 过 站 后 口交 > 
人 <hlL>Mw Pet Dog<y/ hn1L> 

17. 什么 是 DNS 杏 找 ? <img Sre = "ROVer 。，]Pg"> 

18. 如 果 一 台 计 算 机 的 助 记 因特网 地 址 是 </bodwv> 
Datmanmn .batcave .metreopolL1Ss .goVw， < /html> 
推测 一 下 该 机 器 所 在 域 的 结构 是 什么 样 的 ? 30. 使 用 本 章 介绍 的 非 正规 XML 风格 来 设计 一 

19. 解释 电子 邮件 地 址 kermitearirmals . 个 标记 语言 ， 把 简单 的 代数 表达 式 表 示 为 文 
com 的 组 成 。 本 文件 。 

20. 在 FTP 语 境 下 ，“ 文 本 文件 ”和 “二 进 制 文 31. 使 用 文本 中 出 现 的 非 形 式 化 XML 风格 ， 设 计 
件 ” 的 区 别 是 什么 ? 一 组 标签 ， 文 字 处 理 器 可 能 用 到 这 些 标签 标 

21. 邮件 服务 器 的 功能 是 什么 ? 记 潜 在 的 文本 。 例 如 ， 一 修文 字 处 理 上 船 如 何 

22. 给 出 下 列 名 词 的 定义 。 指示 出 哪个 文本 应 该 是 粗 体 、 斜 体 、 下 划 线 
a. 名 字 服 务 器 等 ? 

b， 域 32. 用 本 章 介 绍 的 非 正 规 XML 风 格 来 设计 一 组 
c， 路 由 器 标记 ， 使 得 可 以 根据 文本 项 在 打印 页 上 的 出 
d. 主机 现 方 法 给 电影 评论 做 标记 。 然 后 再 设计 一 组 

23. 远程 登录 协议 中 ， 网 络 虚 拟 终端 的 功能 是 什 标记 ， 可 以 用 于 根据 文本 中 这 些 项 的 含义 标 
人 么 ? 记 电 影评 论 。 

24. 给 下 列 名 词 的 定义。 33. 用 本 章 介 绍 的 非 正 规 XML 风格 来 设计 一 组 
a. 超 文本 标记 ， 可 以 用 于 根据 文本 项 在 打印 页 上 的 出 
b. HTML 现 方 法 给 运动 比赛 项 目的 文章 做 标记 。 然 后 
c, 浏览 器 再 设计 一 组 标记 ， 可 以 用 于 根据 文本 中 这 些 

25. 因特网 的 许多 “外 行 用 户 ” 混 用 因特网 和 万 项 的 含义 标记 这 些 文 章 。 

维 网 。 这 两 个 术语 的 正确 含义 是 指 什么 ? 34. 说 出 下 面 URL 的 组 成 ， 并 描述 各 项 的 含义 。 

26 在 浏览 一 个 简单 的 Web 文 档 果 ， 让 浏 必 禹 是 httDp:y77 Litetormns ,com/ animals/ 

示 该 文档 的 源 版 本 ， 然 后 说 出 该 文档 的 基本 TIGWVT 后 号 七 己 荆 S /上 zImlLt .也 七 可] 
结构 。 特 别 是 ， 说 出 该 文档 的 首部 和 主体 ， 
并 列 出 你 在 首部 和 主体 中 发 现 的 一 些 语句 。 35. 说 出 了 列 箱 号 URL 的 组 成 ， 

27， 列 出 5 种 HTMIL 标签， 并 说 出 它们 的 含义 。 和 

28. 修改 下 面 的 HTML 文 档 ， 使 单词 Rover 链接 到 Ri 
URL 为 http:/7animals,corgyAPpets/ b，httP: /7 CastLes5 .ozg7 
dogs .html 的 文档 。 C，Www .CoOD]1SEuULEE .Com 
ie 36. 如 果 要 浏览 器 在 下 列 两 个 URL“ 找 文件 ”， 
Cs 浏览 器 的 动作 有 什么 不 同 ? 
<tIL1Le>ExampTe</ 世 IE e> 用 七 七 瑟 : 77 SB 七 忌 工 可 己 ZeI ,ULVBISe .OOIS 
< neae> ht 记 S:7 7 SLaLrgazer universe.oOrg 
<DDodyw> 
<h1>My Pet Dog</yh1l> 37. 给 出 万 维 网 上 两 个 客户 痊 锋 动 的 例子 和 两 个 
<D>MYy dog's name 1s Rover .</P> 服务 器 端 活 动 的 例子 。 
</boaey> *38， 什 么 是 OSI 参考 模型 ? 

*39. 在 一 个 基于 总 线 型 拓扑 结构 的 网 络 里 ， 总 线 

29. 画 一 个 草图 来 说 明 下 面 的 HTML 文档 在 计算 


机 屏 帮 上 的 显示 信息 。 





对 于 要 传送 报 文 的 机 器 是 必须 觉 争 的 不 可 共 
享 资源 。 在 这 种 环境 里 死 锁 是 如 何 控制 的 ? 


中 
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*40. 列 出 因特网 软件 层次 结构 的 4 层 , 并 说 明 各 层 b. 产地 址 
所 完成 的 任务 。 cc 应 用 类 型 

+41. 为 什么 传输 层 把 长 报 文 划分 为 小 报 妆 ? 46. 假定 你 想 建立 一 个 可 以 过 滤 掉 包含 其 些 术语 

*42. 当 某 应 用 程序 要 求 传 输 层 使 用 TCP 来 传输 报 和 蛤 语 的 电子 邮件 报 文 的 防火 墙 。 这 个 防火 
文 时 ， 为 了 满足 应 用 屋 的 要 求 ， 传 输 层 需要 墙 应 该 放 在 域 的 网 关上 ， 还 是 放 在 域 的 邮件 
附加 什么 样 的 报 文 ? 服务 器 上 ? 说 明理 由 。 

+43. 在 实现 传输 屋 时 ， 什 么 情况 下 TCP 优 于 47. 什么 是 代理 服务 器 以 及 使 用 代理 服务 器 的 好 
UDP? 什么 情况 下 UDP 优 于 TCP? 处 ? 

*44, 说 UDP 是 无 连接 协议 的 售 尽 是 什么 ? 48. 总 结 公 钥 加 密 的 原理 。 

*45. 在 TCPAP 协 议 层 次 结构 里 ， 为 了 用 下 列 方法 49. 一 台 不 工作 但 未 设防 的 PC 是 如 和 何 感 胁 因 特 
过 让 进来 的 通信 流 ， 防 火 墙 应 该 设置 在 哪 一 网 的 ? 
层 ? 50. 对 于 整个 因特网 界限 制 用 法 律 来 解决 因特网 

a.， 报 文 内 容 存在 的 问题 ， 你 如 何 看 待 ? 
社会 问题 


下 和 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问 题 。 回 答 这 些 问 题 不 

是 叭 一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

. 通过 网 络 连接 计算 机 使 得 在 家 办 公 的 观念 流行 起 来 。 这 种 变化 有 哪些 利弊 ? 它 对 自然 资 
源 的 消费 有 什么 影响 ? 它 会 使 家 庭 巩固 吗 ? 它 会 减少 “办 公 室 政治 ” 吗 ? 在 家 里 办 公 的 
人 和 在 现场 办 公 的 人 会 有 同样 的 职务 晋升 机 会 吗 ? 减少 和 同行 之 间 的 个 人 接触 会 有 正面 
的 还 是 负面 的 影 啊 ? 

. 在 因特网 上 购物 正在 变 成 “亲身 ”购物 的 一 个 替代 品 。 这 种 购物 习惯 的 变化 对 于 社会 有 
什么 影响 ? 对 于 大 型 购物 中 心 的 影响 呢 ? 对 于 你 通常 只 和 逛 不 买 的， 比如 书店 和 服装 店 之 
关 的 小 店 呢 ? 以 尽 可 能 最 低 价格 购买 ， 好 到 什么 程度 ， 坏 到 什么 程度 ? 你 是 否 有 这 样 的 
违 义 上 的 责任 ， 多 花 一 点 钱 购 买 一 个 商品 来 支持 本 地 的 商业 ? 比较 本 地 商店 里 的 商品 ， 
然后 通过 因特网 以 较 低 的 价格 订购 ， 这 合理 吗 ? 这 种 行为 的 长 期 后 果 会 是 什么 ? 

. 政府 对 其 公民 访问 因特网 《或 其 他 国际 性 网 络 ) 的 控制 应 当 限 制 在 什么 程度 内 ? 涉及 国 
家 安全 的 问题 包括 哪些 ? 可 能 发 生 哪些 安全 问题 ? 

. 电子 公告 牌 允 许 网 络 用户 发 布 报 文 〈 常 以 匿名 方式 ) 和 阅读 其 他 用 户 发 布 的 报 文 。 管 理 
人 员 应 该 对 这 个 公告 牌 的 内 容 负责 吗 ? 电话 公司 应 该 对 电话 的 通信 内 容 负责 吗 ? 食品 杂 
捧 店 的 管理 者 要 对 店内 的 社团 公告 牌 内 容 负责 吗 ? 

' 因特网 的 使 用 应 当 被 监视 吗 ? 应 当 被 管制 吗 ? 如 果 需 要 ， 应 该 由 谁 来 管理 ， 管 理 到 什么 
程度 ? 

: 你 花费 多 少时 间 来 上 因特网 ? 那些 时 间 花 得 值 吗 ? 上 网 改变 你 的 社会 活动 了 吗 ? 你 认为 
通过 因特网 与 人 交谈 比 面对面 与 人 交谈 更 容易 吗 ? 

. 当 你 为 个 人 计算 机 买 了 一 个 软件 包 的 时 候 ， 开 发 商 通常 要 你 向 开发 商 注册 ， 以 便 你 可 以 
得 到 未 来 升级 的 通知 。 这 种 注册 过 程 越 来 越 多 地 通过 因特网 处 理 ， 经 常 要 你 提供 诸如 姓 
名 、 地 址 以 及 如 何 知道 产品 等 信息 ， 然 后 开发 商 的 软件 自动 把 这 些 数 据 传输 给 开发 人 员 。 

如 要 开发 商 设计 的 注册 软件 在 注册 过 程 还 把 额外 的 信息 发 送 给 开发 人 员 ， 那 么 会 发 生 什 
么 道德 问题 吗 ? 比如 ， 注 册 软 件 扫描 你 的 系统 内 容 ， 报 告 找到 的 其 他 软件 。 

. 当 你 访问 一 个 网 站 时 ， 这 个 站 点 有 在 你 的 计算 机 内 记录 数据 的 能 力 ， 从 而 显示 你 曾经 访 
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问 过 该 站 点 ， 这 称 为 cookies。 然 后 这 些 cookies 用 来 识别 回访 的 访问 者 ， 并 提供 你 以 前 的 
访问 记录 ， 所 以 网 站 可 以 更 高 效 地 控制 将 来 的 访问 者 。 网 站 应 该 有 在 你 的 计算 机 内 记录 
cookies 这 样 的 功能 吗 ? 未 经 你 的 同意 ， 是 否 人 允许 网 站 在 你 的 计算 机 里 记录 cookies? 
cookies 可 能 的 好 处 是 什么 ? 使 用 cookies 可 能 会 引发 什么 问题 ? 

9. 如 果 政 府 机 构 要 求 公 司 注册 他 们 的 加 密 密 铀 ， 公 司 还 是 安全 的 吗 ? 

10. 一 般 来 说 ， 出 于 礼 台 我 们 不 会 为 了 安排 周末 外 出 之 类 的 个 人 或 社团 的 事情 而 给 在 工作 场 
所 的 朋友 打 电 话 。 类 似 地 ， 大 多 数 人 也 不 愿意 打 电 话 到 客户 的 家 里 介绍 新 产品 。 按照 类 
似 的 习俗 ， 我 们 把 婚礼 请 柬 寡 到 客人 的 住所 ， 而 把 商 务 会 议 的 通知 邮寄 到 出 席 者 的 工作 
地 址 。 把 给 朋友 的 私人 电子 邮件 通过 邮件 服务 器 发 到 他 工作 的 地 方 合适 吗 ? 

11. 假定 一 个 PC 的 所 有 者 让 这 人 台 PC 接 入 因特网 , 但 最 终 这 人 台 电脑 被 其 他 人 用 来 进行 拒绝 服务 
攻击 。 这 个 PC 的 所 有 者 该 负 多 大 的 责任 ? 你 的 回答 和 他 是 否 安装 了 正确 的 防火 墙 有 关 
芭 ? 

12. 一 个 生产 糖果 和 玩具 的 公司 在 他 们 的 公司 网 站 上 提供 游戏 ， 在 推荐 公司 产品 的 同时 证 孩 
子 们 娱乐 ， 这 种 做 法 道德 吗 ? 如 果 游 戏 是 用 来 收集 来 自 小 孩 信 息 的 ， 那 允 如何 ? 娱乐 、 
广告 和 利用 之 间 的 界限 是 什么 ? 
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-一 
本 





算 法 


“绪论 ”一 章 中 我 们 知道 ， 计 算 机 科学 的 核心 主题 是 对 算法 的 研究 。 现在 是 我 们 关注 这 个 

核心 主题 的 时 候 了 。 我 们 的 目标 是 探究 足够 的 基本 素材 来 真正 地 理解 和 认识 计算 科学 。 

我 们 已 经 知道 ， 在 计算 机 能 够 完成 一 个 任务 之 前 ， 必 须 给 出 一 个 算法 来 精确 地 告诉 计算 机 

去 做 什么 因此， 算法 的 研究 是 计算 机 科学 的 基石 。 在 本 章 中 ， 我 们 将 介绍 算法 研究 的 许多 基 
本 概念 ， 





问题 的 同时 ， 我 们 还 会 介绍 几 个 有 关 查 找 和 排序 的 著名 算法 。 下 面 首 先 介绍 算法 的 概念 。 


生计 辣 于 汪 二 后 才 基 或 中 名 生生 直人 2 下 





下 村 人 


5.1 ”算法 的 概念 


在 “绪论 ”一 章 中 ， 我 们 把 算法 非 正 式 地 定义 为 描述 如 何 完成 任务 的 步骤 集 。 在 本 节 中 ， 
我 们 将 进一步 地 讨论 算法 的 基本 概念 。 


5.1.1 概览 


在 表面 的 学 习 中 ， 我 们 已 经 遇 到 了 多 个 算法 。 我 们 发 现 了 用 来 进行 数 制 转换 的 算法 、 检 测 和 纠 
正 数据 铬 误 的 算法 ， 压 缩 和 解压 缩 数 据 文件 的 算法 , 在 多 任务 环境 中 控制 多 道 程 序 设 计 的 算法 以 及 
很 多 其 他 的 算法 。 此 外 ， 我 们 已 经 看 到 ，CPU 所 遵循 的 机 器 周期 与 下 面 这 个 算法 一 样 简单 。 

只 要 未 发 出 停机 指令 就 执行 以 下 步骤 ; 

a. 取 一 条 指令 ; 

b， 解 码 该 指令 ; 

c， 执 行 该 指令 。 

就 像 图 0-1 中 的 麻 术 的 算法 所 展示 的 那样 ， 实际 上 和 它 甚至 可 以 
用 来 描述 剥 豌豆 过 这样 的 普通 活动 。 

获得 一 篮子 未 剥皮 的 豌豆 和 一 只 空 碗 。 只 要 篮 中 还 有 防 豆 就 执行 下 面 的 步骤 ， 

a， 从 篮子 里 拿 出 一 个 可 豆 ; 

b.， 剥 开 副 豆 的 豆 菠 ; 

c,， 把 剥落 的 豆 放 到 碗 里 面 ; 

d， 扎 掉 空 豆 贡 。 
实际 上 ， 许 多 研究 人 员 相信 : 人 脑 中 的 每 一 个 活动 ， 包 括 幻 想 、 创 造 和 决策 ， 实 际 上 都 是 算法 
执行 的 结果 一 一 我 们 将 在 学 习 人 工 智 能 〈 第 11 章 ) 时 介绍 。 

日 是 ， 在 继续 深入 研究 之 前 ， 让 我 们 先 考 虑 一 下 算法 的 正式 定义 。 


5.1.2 ”算法 的 正式 定义 
非 正式 、 不 严格 地 定义 的 概念 在 日 常生 活 中 是 可 接受 的 并 且 是 很 常见 的 ， 但 是 科学 必须 基 
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于 严谨 定 义 的 术语 之 上 。 现 在 ， 我 们 就 来 考察 一 下 图 $-1 中 的 算法 的 正式 定义 。 





图 5-1 ”算法 的 定义 


注意 ， 该 定义 要 求 一 个 算法 中 的 步骤 集合 是 有 序 的 。 这 意味 着 ， 一 个 算法 中 的 各 个 步骤 必 
须 有 一 个 非常 明确 的 、 顺 序 执行 的 结构 。 这 并 不 意味 着 这 些 步骤 必须 从 第 1 步 ， 到 第 2 步 ， 再 
到 下 一 步 ， 这 样 的 硕 厅 执 行 。 有 些 算 法 ， 比 如 并 行 算 法 ， 包 含 的 步骤 序列 不 只 一 个 ， 每 一 个 序 
列 都 筱 设计 成 由 多 个 处 理 器 中 的 不 同 处理 器 执行 。 在 这 种 情况 下 ， 整 个 算法 并 不 包含 一 个 遵照 
第 1 步 、 第 2 步 这 样 的 顺序 步骤 方式 的 线程 ， 而 其 结构 是 一 种 多 线程 结构 ， 因 为 这 些 线程 在 整 
个 任务 中 的 不 同 部 分 被 不 同 的 处 理 器 执行 (我 们 会 在 第 6 章 中 再 次 讨论 这 个 概念 )。 其 他 例子 包 
括 像 第 1 章 中 所 讲述 的 触发 器 电路 执行 的 算法 ， 这 此 电路 中 每 一 个 门 电路 都 完成 了 整个 算法 的 
一 步 。 这里， 这 些 步 骤 是 按照 因果 关系 排列 的 ， 每 个 门 电路 的 结果 都 是 通过 电路 传播 的 。 

搂 下 来 ， 我 们 考虑 算法 必须 由 可 执行 的 步骤 组 成 的 要 求 。 为 了 满足 这 个 条 件 ， 我 们 考察 下 
面 这 条 指令 : 


给 出 一 个 所 有 正 整 数 的 列表 。 


由 于 正 整数 有 无 穷 多 个 ， 所 以 完成 这 条 指令 几乎 是 不 可 能 的 。 因 此 ， 任 何 包括 这 条 指令 的 指令 
集 部 不 能 称 作 一 个 算法 。 计算 机 科学 家 使 用 有 效 的 〈effiective) 这 个 术语 来 表示 可 执行 的 概念 。 
也 就 是 说 ， 说 算法 中 的 一 个 步骤 是 有 效 的 就 意味 着 它 是 可 执行 的 。 

贸 5-1 中 的 和 法 定义 的 另外 一 个 要 求 是 算法 中 的 步骤 必须 是 无 歧义 的 。 这 意味 着 在 算法 的 
执行 过 程 中 , 正在 被 处 理 的 信息 必须 足以 唯一 地 、 完 整地 确定 每 一 步 所 需要 的 动作 。 换 句 话说 ， 
算法 中 的 每 一 步 的 执行 都 不 需要 创造 性 的 技能 ， 只 要 求 遵 照 指 令 执 行 。( 在 第 12 章 我 们 将 学 习 
的 得法 称 为 非 确定 性 算法 但 该 算法 不 受 这 里 的 限制 ， 属 于 另外 一 个 重要 的 研究 论题 。) 

图 5-1 给 出 的 定义 还 要 求 ， 算 法 定义 的 是 一 个 可 终止 的 过 程 ， 也 就 是 说 ， 一 个 算法 的 执行 
必须 能 够 最 终结 束 。 这 个 要 求 源 自理 论 计算 机 科学 ， 其 目标 是 要 回答 诸如 “算法 和 机 器 的 最 终 
限制 是 什么 ? ”之 类 的 问题 。 其 中 ， 计 算 机 科学 试图 寻找 下 面 两 个 问题 的 区 别 ， 其 答案 的 获得 
是 在 算法 系统 能 力 范围 之 内 ， 还 是 超出 了 算法 系统 能 力 范 围 。 从 这 个 意义 上 讲 ， 它 在 以 一 个 答 
案 告终 的 过 程 与 一 个 只 能 向 前 执行 而 不 能 得 到 结果 的 过 程 之 间 存 在 着 一 条 分 割 线 。 

可 和 是 ， 还 是 有 一 些 不 可 终止 的 过 程 是 非常 有 意义 的 ， 包 括 监视 病人 的 生命 特征 和 维持 飞行 
器 的 飞行 高 度 等 。 有 些 人 可 能 辩 称 这 些 问 题 仅 仅 是 算法 的 重复 ， 这 其 中 的 每 一 个 算法 都 会 在 到 
公 结 束 状 态 之 后 自动 继续 重复 执行 。 另 外 一 些 反 对 这 一 论点 的 人 可 能 认为 ， 这 种 说 法 只 不 过 是 
一 种 对 于 正式 定义 限制 的 过 度 坚 持 。 不 管 是 哪 种 情况 ， 结 果 都 是 算法 这 个 名 词 通常 使 用 在 对 步 
骤 集 合 的 实用 的 或 者 非 形式 的 引用 ， 并 不 一 定 必须 定义 一 个 可 终止 的 过 程 。 例 如 ， 长 除法 “ 算 
法 ， 当 1 除 以 3 的 时 候 ， 这 个 算法 并 不 定义 一 个 可 终止 的 过 程 。 从 技术 上 讲 ， 这 些 例子 都 表示 
对 该 术语 的 误 用 。 


5.1.3 算法 的 抽象 本 质 


甬 调 算法 与 其 表示 的 区 别 是 非常 重要 的 ， 这 就 好 像 一 个 故事 和 一 本 书 的 差别 。 一 个 故事 本 
质 上 和 古 抽象 的 ， 或 者 说 是 概念 上 的 ;而 一 本 书 是 一 个 故事 的 物理 表示 。 如 果 一 本 书 被 翻译 成 其 
介 语 言 或 者 以 另外 一 种 样式 出 版 ， 仅仅 是 这 个 故事 的 表示 形式 改变 了 ， 而 故事 本 身 并 没有 变化 。 
同样 ， 算 法 是 抽象 的 ， 与 它 的 表示 是 有 差别 的 。 一 个 算法 可 以 用 多 种 方式 来 表示 。 比 如 ， 
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在 华氏 温度 和 摄氏 温度 之 间 进 行 转 换 的 算法 可 以 用 下 面 的 代数 公式 表示 ， 


人 
但 也 可 以 用 下 面 的 指令 表示 : 
将 摄氏 温度 数值 乘 以 = ， 然 后 在 乘积 上 加 32。 


甚至 可 以 用 电路 的 形式 予以 表示 。 无 论 哪 种 情况 ， 基 本 的 算法 是 一 致 的 ， 只 不 过 是 表示 方式 不 
同 罢了 。 

算法 和 它 的 表示 的 区 别 体现 了 我 们 在 传达 一 个 算法 的 时 候 存 在 的 问题 。 一 个 常见 的 例子 
是 ， 一 个 算法 蜂 须 拉 述 到 什么 样 的 细致 程度 。 对 于 气象 学 家 来 说 ， 指 令 “ 将 读 入 的 摄氏 度数 
转换 为 相应 的 华氏 度数 ”就 足够 了 ， 但 是 ， 对 于 一 个 外 行 来 说 《需要 更 加 详细 的 描述 ) 可 能 
会 认为 这 个 指令 是 模糊 的 、 有 此 义 的 。 然 而 ， 问 题 并 不 在 于 算法 存在 歧义 ， 而 是 算法 并 没有 
很 好 地 按照 外 行 所 要 求 的 细致 程度 进行 表示 。 因 此 ， 歧 义 性 存在 于 算法 的 表示 ， 而 不 是 算法 
本 身 。 在 5.2 节 中 , 我们 会 学 习 原 语 的 概念 ， 并 看 到 原 语 是 如 何 被 用 于 消除 算法 表示 中 的 这 种 
政 义 性 问题 的 。 

最 后 , 在 算法 和 它 的 表示 这 个 问题 上 , 我 们 应 该 明确 另外 两 个 概念 的 区 别 一 一 程序 和 进程 。 
程序 是 一 个 算法 的 表示 。( 这 里 ， 我 们 没有 在 正式 意义 上 使 用 术语 算法 ， 因 为 许多 程序 是 不 可 终 
止 的 “算法 ”的 表示 。) 实际 上 ， 计 算 机 科学 家 用 程序 这 个 词 表 示 那 些 设计 成 计算 机 应 用 程序 的 
算法 的 表示 。 在 第 3 章 中 ， 我 们 把 进程 定义 为 执行 程序 的 活动 。 然 而 ， 我 们 注意 到 执行 一 个 程 
序 姚 是 在 执行 由 该 程序 所 表示 的 算法 ， 所 以 一 个 进程 可 以 等 价 地 定义 为 执行 一 个 算法 的 活动 。 
我 们 可 以 得 到 这 种 结论， 程序、 算法 和 进程 既是 不 同 的 却 又 有 关联 的 。 程 序 是 算法 的 表示 ， 而 
进程 又 是 执行 算法 的 活动 。 


问题 与 练习 

1. 简 述 进程 、 算 法 和 程序 之 间 的 区 别 。 

2. 给 出 一 些 你 所 熟悉 的 算法 的 例子 。 它 们 是 精确 意义 上 的 算法 吗 ? 

3. 对 于 在 0.1 节 中 给 出 的 算法 的 非 正 式 定义 ， 存 在 哪些 有 歧义 的 含糊 的 ) 地 方 ? 
4. 从 什么 意义 上 说 ， 由 下 列 指令 列表 所 描述 的 步骤 不 能 构成 算法 ? 

第 1 步 ， 从 你 的 口袋 里 取出 一 校 硬币 并 且 把 它 放 到 桌子 上 。 

溃 2 步 ; 返回 第 1 步 ， 
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在 本 节 中 ， 我 们 考虑 与 算法 的 表示 有 关 的 问题 。 我 们 的 目标 是 引入 原 语 和 伪 代 码 的 基本 概 
念 ， 并 且 建 立 一 种 为 我 们 所 用 的 算法 表示 系统 。 


5.2.1 原 语 


一 个 算法 的 表示 需要 使 用 某 种 形式 的 语言 。 对 于 人 类 ， 这 可 能 是 一 种 传统 的 自然 诸 言 〈 英 
语 、 西 班 牙 语 、 俄 语 、 日 语 )， 或 者 可 能 是 一 种 图 形 语 言 ， 就 像 图 5-2 所 示 ， 在 这 个 图 中 ， 我 们 
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给 出 了 用 一 块 正方 形 纸 片 释 出 一 只 鸟 的 算法 。 然 而 ， 这 种 自然 的 沟通 方式 芝 常 会 引起 误解 ， 有 
些 时 候 是 因为 算法 描述 中 使 用 的 术语 可 能 拥有 多 种 含义 。 例 如 ,， 何 子 “Visiting grandchildren can 
be nerve-racking.” 可 能 表示 去 看 望 孙子 时 他 们 会 车 出 事情 ， 也 可 能 表示 去 看 孙子 是 一 件 很 费 周 
折 的 事情 。 很 少 有 读者 能 够 按照 图 5-2 给 出 的 步骤 成 功 地 有 登 出 一 上 只 小 乌 来 ， 但 是 一 个 专门 学 习 
过 折纸 的 学 生 可 能 很 轻松 地 就 将 其 完成 。 简 言 之 ， 当 用 来 描述 算法 的 语言 并 没有 被 准确 定义 或 
者 并 没有 给 予 足够 详细 的 信息 的 时 候 ， 交 流 就 会 产生 问题 。 


/7 人 -全 2z、 
人 -8Q-e 
SS 二 人 汉 
疫 没 -人 
大 


图 5-2 ”由 一 张 正方 形 的 纸 折 登 成 一 只 鸟 


计算 机 科学 解决 这 些 问题 的 途径 是 建立 一 组 严格 定义 的 构件 块 ， 利 用 它们 来 构建 算法 的 表 
示 。 这 种 构件 块 称 作 原 语 〈primitive)。 赋 予 原 语 准确 的 定义 消除 了 很 多 由 于 歧义 造成 的 问题 ， 
并 且 要 求 按照 这 些 原 语 来 描述 算法 就 是 确定 了 一 致 的 细节 层次 。 原 语 的 集合 以 及 说 明 如 何 组 合 
这 些 原 语 来 表示 比较 复杂 的 想法 的 规则 集合 就 构成 了 一 种 程序 设计 语言 。 

每 个 原 语 都 有 自己 的 语法 和 语义 。 语 法 是 原 语 的 符号 表示 ， 语 义 是 指 该 原 语 的 含义 。air 一 
词 的 语法 由 3 个 符号 组 成 ,然而 其 语义 是 一 种 充满 整个 世界 的 气体 物质 。 作 为 一 个 例子 ,图 5-3 
描述 了 折纸 术 中 使 用 的 一 些 原 语 。 

为 了 获得 用 来 描述 由 计算 机 执行 的 算法 的 原 语 的 集合 ， 我 们 需要 借助 于 计算 机 执行 的 单个 
指令 。 如 果 一 个 算法 在 这 个 级 别 上 加 以 描述 ， 我 们 肯定 会 得 到 一 个 适合 计算 机 执行 的 程序 。 然 
而 ， 在 这 个 级 别 上 撕 述 的 算法 是 非常 单调 的 ， 所 以 ， 我 们 一 般 使 用 一 个 “更 高 级 ”的 原 语 ， 其 
中 每 个 怕 语 都 是 由 机 器 语言 提供 的 较 低 级 的 原 语 组 成 的 抽象 工具 所 构成 的 。 因 此 ， 结 果 就 是 ， 
我 们 可 以 得 到 一 个 概念 上 比 机 器 语言 更 高 级 的 方式 来 描述 算法 的 正式 的 程序 设计 语言 。 我 们 将 
在 下 一 章 中 讨论 这 种 程序 设计 语言 。 





语法 语义 
一 ~ 将 纸 翻 面 , 如 SN -rr SN 
纸 的 一 面 用 区 分 纸 的 两 面 ， 如 
二 一 -人 心 
AN 表示 四 折 交 线 
、 使 得 表示 SN 
表示 凸 折 桓 线 
使 得 呈 表示 SN 
向 上 折 


包 推进 去 由 出 个 


图 $-3 ”折纸 术 的 原 语 





rserrrorpecriremereryesierroy 二 ev 
能 力 。 因此， 复杂 算法 的 设计 者 需要 一 种 记录 和 重视 发 展 算法 的 部 分 的 方法 。 

在 20 世 纪 50 和 60 年 代 ， 流 程 图 ( 算法 可 以 由 苦头 相互 连接 的 几何 图 形 表示 ) 表述 了 一 种 
工艺 状态 的 设计 工具 。 然 而 ， 流 程 图 经 常 变 成 一 个 由 相互 交叉 的 箭头 组 成 的 复杂 网 ， 这 样 就 
给 理解 算法 的 根本 结构 带 来 了 难度 . 因此 , 流程 图 当 作 设计 工具 的 使 用 只 能 让 位 于 其 他 方法 . 
一 个 例子 就 是 本 书 中 使 用 的 擅 代 码 ， 通 过 这 种 伪 代 码 ， 算 法 可 以 被 表示 成 定 允 明确 的 文 
构 ， en 
图 5-8 和 图 5-9 用 流程 图 来 展现 出 由 流行 的 控制 语句 表示 的 算法 结构 

对 于 更 优 的 设计 方法 的 研究 仍 在 继续 。 在 第 7 章 中 ， 我 们 将 看 到 使 用 图形 技术 来 辅助 大 
型 软件 系统 设计 的 趋势 ， 但 是 伪 代 码 在 设计 小 一 些 的 系统 的 过 程 化 构件 中 仍然 很 流行 


5.2.2 伪 代 码 


现在 我 们 暂时 不 介绍 正式 的 程序 设计 语言 , 而 转向 介绍 一 种 非 正 式 但 更 加 直观 的 符号 系统 ， 
这 个 系统 称 作伪 代码 。 一 般 而 言 ， 伪 代码 〈pseudocode) 是 一 种 在 算法 开发 过 程 中 非 正式 地 表 
达 思 想 的 符号 系统 。 
一 种 简单 地 获得 伪 代 码 的 方法 是 放松 正式 语言 用 于 表达 最 终 算法 的 那些 规则 要 求 。 这 个 
[310 方法 通常 是 在 目标 程序 设计 语言 已 经 预先 知道 的 情况 下 使 用 这 种 在 程序 开发 初期 使 用 的 伪 







.2 工法 的 表示 135 


代码 是 由 语法 -语义 结构 组 成 的 ， 这 种 结构 类 似 于 目标 程序 设计 语言 所 使 用 的 结构 ， 但 是 不 
那么 正规 。 

当然 ， 我 们 的 目标 是 ， 考 虑 在 不 把 我 们 的 讨论 限定 于 特定 程序 设计 语言 的 情况 下 算法 的 开 
发 和 表示 问题 。 因 此 ， 我 们 得 到 伪 代 码 的 办 法 是 开发 一 种 一 致 的 、 简 明 的 用 来 表示 循环 语义 结 
构 的 方法 。 这 样 一 来 ， 这 些 结构 将 成 为 我 们 表达 思想 的 原 语 。 


这 样 的 循环 语义 结构 之 一 是 保存 计算 的 值 。 比 如 ， 我 们 计算 了 日 用 账户 和 存 积 账户 上 的 结 


余 总 和 ， 并 打算 保存 这 个 结果 以 便 以 后 引用 。 在 这 种 情况 下 ， 我 们 用 : 
名 字 二 表达 式 
形式 表达 ， 其 中 ， 名 字 是 我 们 欲 引用 结果 的 名 字 ， 而 表达 式 则 描述 其 结果 将 被 保存 的 计算 。 我 


们 将 这 个 语句 读 为 “把 表达 式 的 值 赋 给 该 名 字 ”， 并 且 我 们 称 该 语句 为 值 赋 语 句 〈assignment 
statement)。 人 例如， 语句 


RemainingFunds 一 CheckingBalance 二 SavingsBalance 


是 把 CheckingBalance 与 SavingsBalance 的 值 相 加 的 结果 赋 给 名 字 RemainingFunds。 这 样 ， 
RemainingFunds 可 以 在 将 来 的 语句 中 用 于 引用 该 总 和 的 值 。 
另 一 个 递归 语义 结构 是 ， 根据 某 个 条 件 的 真 与 假 从 两 个 可 能 的 活动 中 选择 一 个 。 这 样 的 例 
子 有 : 
如 果 国 内 生产 总 值 增长 了 ， 那 么 买 进 普通 股票 ;否则 ， 卖 出 普通 股票 。 


若 国 民生 产 总 值 增长 了 买 进 普通 股票 ， 否 则 就 卖 出 。 
买 进 或 卖 出 普通 股票 取决 于 国内 生产 总 值 的 增长 或 减少 。 


每 个 这 样 的 语句 都 可 以 写成 符合 如 下 结构 的 形式 ; 


放 (条 件 ) then (活动 ) 
else (活动 ) 


这 里 ， 我 们 使 用 了 关键 字 放 〈《 如 果 )、then (那么 ) 和 else〈 和 否则 ) 来 指示 这 个 主 结构 中 的 不 同 


子 结构 ， 并 且 使 用 括号 来 限定 子 结构 的 界限 。 采 用 这 种 语法 结构 作为 伪 代 码 ， 我 们 便 得 到 了 可 


以 表达 这 种 常用 语义 结构 的 统一 方法 。 这 就 是 我 们 的 目的 。 尽 管 语 铝 
根据 该 年 份 是 否 是 半年 ， 总 天 数 相应 地 被 366 或 365 除 。 
可 能 会 产生 一 种 更 富有 创造 性 的 文字 风格 ， 但 是 我 们 将 坚持 选择 简单 的 形式 ; 


计 (年 份 是 头 年 ) 
then (总 天 数 一 总 天 数 被 366 除 ) 
else (总 天 数 一 总 天 数 被 365 除 ) 


我 们 也 可 以 采用 较 短 的 语法 : 
if (条 件 ) then (活动 ) 

这 种 形式 不 涉及 否则 情况 下 的 活动 。 利 用 这 种 表示 形式 ， 语 名 
如 果 处 于 销售 额 减少 的 场合 ， 那 么 价格 降低 5%。 

将 可 以 简化 为 : 
if (销售 额 降低 ) then (价格 降低 5%) 


ka 
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勇 一 个 常用 的 语义 结构 是 : 只 要 某 个 条 件 为 真 ， 一 个 语句 或 一 组 语句 将 重复 地 执行 。 这 样 
的 例子 有 : 

只 要 有 票 可 卖 ， 那 么 继续 售票 。 
和 

当 有 款 可 以 卖 时 ， 保 持 售票 的 状态 。 
对 于 这 两 个 情况 ， 我 们 采用 下 列 统一 的 模式 作为 擅 代 码 : 


while (条 件 ) do (活动 ) 


简 而 言 之 ， 这 个 语句 意味 着 : 检查 条 件 ， 如 果 为 真 ， 那 么 实现 活动 ， 然 后 返回 再 次 检查 条 件 。 但 
是 ， 如 果 发 现 条 件 为 假 ， 那 么 就 转 到 while 结构 的 下 一 个 结构 。 于 是 ， 前 面 的 语句 可 以 简化 为 


while (仍然 有 票 可 卖 ) do ( 卖 票 ) 
缩 进 通常 可 以 提高 程序 的 可 读 性 。 例 如 ， 语 名 


if (未 下 雨 ) 
then (if (温度 = 热 ) 
then (去 游泳 ) 
else (去 打 高 尔 夫 ) 
) 
else (看 电视 ) 
比 该 语句 的 下 述 格式 容易 理解 ， 

f (未 下 雨 ) then (if (温度 = 热 ) then (去 游泳 ) 

else (去 打 高 尔 夫 )) else (看 电视 ) 

所 以 ， 在 我 们 的 伪 代 码 中 将 使 用 缩 进 。( 注 意 ， 我 们 甚至 可 以 利用 缩 进来 调整 闭 括号 的 位 置 ， 使 
得 它 与 对 应 的 开 括号 对 齐 ， 以 辨认 语句 或 短语 的 作用 范围 。) 

我 们 想 用 伪 代 码 来 描述 那些 在 其 他 应 用 中 可 能 作为 抽象 工具 的 活动 .对 于 这 样 的 程序 单元 ， 
计算 机 科学 有 许多 术语 ， 如 子 程序 、 子 例 程 、 过 程 、 模块 和 函数 等 ， 其 中 每 一 个 在 含义 上 都 有 
目 己 的 变化 。 对 于 我 们 的 伪 代 码 ， 我 们 将 采纳 过 程 (pocedure) 这 个 术语 ， 并 利用 这 个 术语 来 
给 出 一 个 标题 ， 作 为 这 个 伪 代 码 单元 的 名 字 。 更 精确 地 说 ， 我 们 将 使 用 下 列 形式 的 语句 来 作为 
一 个 伪 代 码 单元 的 开始 ， 


procedure 名 称 


其 中 ， 名 称 是 该 单元 特有 的 名 字 。 在 这 个 引导 性 语句 的 后 面 是 一 系列 定义 该 单元 动作 的 语 
句 。 例 如 ， 图 $-4 是 称 为 Greetings 的 过 程 的 伪 代 码 表示 ， 芒 过 程 打 印 “Hello”3 次 。 


procedure Creetings 
Lount 二 3 : 


whilje (Count > 0) do 
(打印 信息 “Hello”: 并 且 
Lount 一 Count - 1) 


图 5-4，” 伪 代码 形式 的 过 程 Creetings 
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当 一 个 过 程 所 实现 的 任务 在 伪 代 码 其 他 地 方 需要 时 ， 只 需要 通过 名 称 来 请 求 它 。 例 如 ， 如 果 
有 取 名 为 ProcessLoan 和 RejectApplication 的 两 个 过 程 , 那么 可 以 通过 下 面 的 语句 在 if-then-else 
结构 内 请 求 它们 的 服务 ; 


if 《条件 ) then (执行 过 程 ProcessLoan) 
else (执行 过 程 RejectApplicatiom) 


当 被 测试 的 条 件 为 真 时 , 执行 过 程 ProcessLoan, 而 在 条 件 为 假 时 , 执行 过 程 RejectApplication。 

如 果 过 程 用 于 不 同 的 环境 ， 设 计 伪 代码 时 应 该 使 其 尽 可 能 通用 。 一 个 给 名 字 列 表 排 序 的 过 
程 应 该 设计 成 能 够 给 任何 列表 《而 不 是 特定 的 列表 ) 排序 ， 因 此 应 该 按照 这 样 的 要 求 来 编写 该 
过 程 : 要 排序 的 列表 不 在 过 程 内 部 详细 说 明 。 事 实 上， 该 列表 在 这 个 过 程 的 伪 代 码 里 以 类 属 名 
来 指称 。 

在 伪 代码 里 ， 我 们 将 采用 这 样 的 约定 ， 这 些 类 属 名 〈 称 为 参数 ) 列 在 括号 里 ， 并 在 标识 过 
程 名 字 的 同一 行 上 。 例 如 ， 一 个 名 为 Sort 的 过 程 《 设 计 成 对 任何 名 字 列 表 进 行 排序 ) 以 下 列 语 
名 开始 : 


procedure Sort (List) 


在 后 面 的 伪 代 码 里 ， 在 需要 引用 要 排序 的 列表 时 ， 就 可 以 使 用 类 属 名 List。 同 样 ， 当 需要 Sort 
的 服务 时 ， 我 们 将 知道 是 什么 列表 要 替代 过 程 Sort 的 参数 List。 于 是 根据 需要 ， 可 以 写成 ; 


把 过 程 Sort 应 用 在 机 构成 员 列表 。 
和 
把 过 程 Sort 应 用 在 婚礼 来 宾 列表 。 


命名 程序 中 的 项 


在 自 然 语言 言 中 ， 项 通常 使 用 多 个 单词 的 名 称 ， 例 如 :， “cost of producing a widget” 或 
estimated arrival time"。 经 验 表 明 ， 在 一 个 算法 表示 中 使 用 这 种 多 个 单词 的 名 称 会 使 算法 的 
描述 复杂 化 。 最 好 让 每 个 项 使 用 一 个 连续 的 文本 块 。 多 年 来 ， 许 多 技术 被 用 于 和 将 多 个 单词 紧 
缩 为 单个 词法 单元 ,以便 为 程序 中 的 项 提供 描述 性 名 称 。 一 种 技术 是 使 用 下 划 线 来 连接 单词 ， 
建立 诸如 estimated_arrival 上 ime 这 样 的 名 称 。 另 一 种 技术 是 用 大 写 字母 帮助 读者 理解 
紧缩 的 多 单词 名 称 。 例 如 ， 我 们 可 以 在 每 个 单词 的 开始 字母 使 用 大写 5 获得 诸如 
EstirmatedaArrivalTime 这 样 的 名 称 。 这 种 技术 称 为 Pascal 样 式 .(Pascal casing ) 因为 该 样 
式 在 Pascal 程 序 设计 语言 的 用 户 中 很 流行 。 一 种 Pascal 样 式 的 变形 称 为 camel 样 武 :(camel 
casing )， 该 样式 除了 首 字 母 小 写 外 ， 其 他 与 Pascal 样 式 相同 ， 如 estimateaaAarrivalTime 
本 书 中 ， 我 们 学 习 Pascal 样 式 ， 但 这 种 选择 很 大 程度 上 是 个 人 偏好 。 


记 住 ， 伪 代码 的 目的 是 要 提供 一 种 用 可 读 的 、 非 形式 的 方法 来 表示 算法 。 我 们 希望 记号 系 
统 能 够 帮助 我 们 表达 思想 ， 而 不 受制 于 严格 的 、 形 式 规 则 。 因 此 ， 在 需要 的 时 候 ， 我 们 可 以 随 
意 扩 充 或 修改 我 们 的 伪 代 码 。 特 别 是 ， 如 果 一 组 括号 中 的 语句 又 涉及 带 括号 的 语句 ， 会 使 括号 
配对 很 困难 。 在 这 些 情况 下 ， 许 多 人 发 现在 闭 括 号 后 面 加 上 简短 的 注释 ， 说 明 是 哪个 语句 终止 
了 ， 是 非常 有 帮助 的 。 特 别 是 ， 在 while 语句 的 闭 括号 后 面 可 以 加 上 end while， 可 以 产生 下 列 
形式 的 语句 : 


138 第 5 章 算 法 


同和 计 人 《...) 十 
( 。 


1 while 


或 着 


人 计生 (...) 二 
(让 《小 
thenr ， 


) end if 
) 起 中 各 While 
其 中 我 们 已 经 指明 了 让 和 while 语句 的 结束 。 
我 们 的 目的 是 ， 用 一 种 可 读 的 形式 来 表达 算法 ， 因此 我 们 可 以 随时 引进 一 些 直观 的 辅助 工 
号 〈 缩 进 、 注 释 等 ) 来 达到 这 个 目的 。 其 次 ， 如 果 碰 到 了 一 个 尚未 在 我 们 的 伪 代 码 中 体现 的 递 
归 问 题 ， 那 么 可 以 选择 扩充 伪 代 码 ， 及 用 一 致 的 语法 来 表示 这 个 新 的 概念 。 


问题 与 练习 

: 一 种 环境 下 的 原 语 可 以 实现 为 另外 一 种 环境 下 原 语 的 “合成 物 ”。 比 如 ，while 语 名 是 伪 代 码 中 的 一 个 
原 语 , 但 是 它 被 作为 机 器 语言 指令 的 一 个 “合成 物 ” 加 以 实现 。 给 出 计算 机 以 外 的 这 种 现象 的 两 个 例子 。 

. 从 何 种 意义 上 讲 ， 过 程 的 结构 就 是 原 语 的 结构 ? 

: 欧 儿 里 得 算法 给 出 了 求 两 个 正 整数 X 和 zy 的 最 大 公约 数 的 算法 : 只 要 X 和 y 的 值 均 不 是 0， 则 继续 用 较 大 
的 数 除 以 较 小 的 数 ， 并 且 将 除数 和 余数 分 别 赋 给 X 和 y (X 最 后 的 值 就 是 最 大 公约 数 ) 。 用 伪 代 码 的 广 
式 表达 这 个 算法 。 

,描述 一 个 在 计算 机 程序 设计 以 外 的 学 科 里 使 用 的 原 语 集合 . 


=。 


EL。 | 


二 
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程序 开发 由 两 个 活动 组 成 一 一 发 现 潜在 的 算法 和 以 程序 的 方式 表示 算法 。 从 这 点 看 ， 我 们 
一 且 在 关注 算法 表示 的 问题 而 未 把 算法 是 如 何 被 发 现 的 问题 放 在 首位 。 但 是 算法 的 发 现在 软件 
开发 过 程 中 往往 是 更 加 具有 挑战 性 的 步骤 。 毕 竟 ， 发 现 一 个 算法 来 解决 问题 需要 找到 一 个 解决 
该 问题 的 方法 。 因 此 ， 要 理解 算法 是 如 何 发 现 的 就 是 要 理解 问题 的 求解 过 程 。 


5.3.1 问题 求解 的 艺术 


门 题 求 解 的 技术 和 学 习 更 多 相关 知识 的 需求 并 不 只 存在 于 计算 机 科学 中 ， 这 是 一 个 几乎 在 
任何 领域 中 都 永久 存在 的 问题 。 由 于 算法 发 现 的 过 程 和 一 般 问 题 的 求解 过 程 之 间 存 在 着 紧密 的 
耿 系 ， 使 得 计算 机 科学 进入 了 那些 试图 寻找 更 好 的 问题 求解 方法 的 学 科 中 。 最 终 ， 我 们 希望 可 
以 把 问题 的 求解 简化 为 一 个 算法 ,但 是 已 经 证 明 这 是 不 可 能 的 。 《这 是 第 12 章 相关 内 容 的 结果 ， 
在 第 12 章 我 们 将 展示 有 些 问 题 是 找 不 到 算法 解决 方法 的 。) 因此 问题 求解 能 力 更 多 地 成 为 一 种 
技艺 去 发 展 ， 而 非 需要 学 习 的 精确 科学 。 

作为 问题 求解 难以 琢磨 、 颇 具 艺术 性 的 本 质 的 证 据 ， 数 学 家 〈 波 利 亚 G. Polya) 在 1945 年 
列 出 了 以 下 非 严格 定义 的 问题 求解 阶段 ， 其 曹 涵 的 基本 原理 直至 今日 仍然 是 教授 问题 求解 技能 
的 基础 。 
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第 1 阶段 ”理解 问题 。 

第 2 阶段 ”设计 一 个 解决 问题 的 计划 。 

第 3 阶段 “完成 计划 。 

第 4 阶段 ”从 准确 度 及 其 是 否 有 潜力 作为 一 个 解决 其 他 问题 的 工具 这 两 方面 来 评估 这 个 计划 。 
我 们 把 上 述 阶 段 移植 到 程序 开发 的 语 境 中 ， 这 些 阶段 变 成 ; 


第 1 阶段 ”理解 问题 。 

第 2 阶段 ”寻找 一 个 可 能 解决 问题 的 算法 过 程 的 思路 。 

”第 3 阶段 ”阐明 算法 并 且 用 程序 将 其 表达 出 来 。 

第 4 阶段 ”从 准确 度 及 其 是 否 有 潜力 作为 一 个 工具 解决 其 他 问题 这 两 方面 来 评估 这 个 程序 。 

在 描述 完 波 利 亚 的 观点 后 ， 我 们 应 该 着 重 强调 这 些 阶段 并 不 是 在 尝试 求解 问题 的 时 候 需 要 
遵循 的 步骤， 而 是 在 求解 过 程 中 有 时 需要 完成 的 阶段 。 这 里 的 关键 词 是 “遵循 ”>。 仅 遵循 这 些 步 
又 是 不 能 求解 问题 的 ， 要 求解 问题 ， 必 须 有 创新 精神 和 领先 一 步 的 意识 。 如 果 你 在 求解 问题 的 
时 候 总 是 抱 有 “现在 我 完成 了 第 1 阶段 ， 该 是 开始 第 2 阶段 的 时 候 了 ”之 类 的 想法 ， 那 么 你 可 能 
根本 不 能 成 功 。 然 而 ， 如 果 你 仔细 考虑 问题 并 且 最 终 解 决 了 它 ， 你 可 以 回想 在 解决 问题 的 过 程 中 
你 都 做 了 些 什 么 ， 并 且 可 以 看 看 是 否 实 现 了 波 利 亚 所 描述 的 各 个 阶段 。 

波 利 亚 阶段 原理 的 另外 一 个 重要 观点 是 并 不 一 定 要 按 顺序 执行 这 些 步骤 。 成 功 的 求解 问题 
者 通 营 是 在 完全 理解 问题 本 身 〈 阶 段 1) 之 前 就 开始 设计 构想 解决 问题 的 策略 〔〈 第 2 阶段 )。 然 
后 ， 如 果 他 们 的 策略 失败 了 【在 第 3 阶段 或 者 第 4 阶段 )， 这 些 人 会 对 这 个 问题 的 复杂 程度 有 更 
深 的 理解 。 基 于 这 些 比较 深入 的 理解 ， 他 们 会 回 过 头 去 构想 另 一 个 更 有 希望 成 功 的 策略 。 

必须 记 住 的 是 ， 我 们 正在 讨论 怎样 求解 问题 一 一 并 不 是 我 们 希望 问题 如 何 解 决 。 在 理想 情 
况 下 ， 我 们 希望 消除 前 面 描述 的 “尝试 -错误 ”过 程 中 的 固有 的 浪费 。 在 开发 大 型 软件 系统 的 情 
况 下 ， 如 果 在 像 第 4 阶段 这 样 晚 的 时 候 才 发 现 问题 ， 那 么 就 会 导致 资源 的 极 大 浪费 。 避 免 这 样 
的 灾难 是 软件 工程 师 的 主要 目标 《第 7 章 )， 他 们 习惯 于 在 执行 解决 方案 之 前 ， 必 须 对 该 问题 有 
一 个 全 面 透彻 的 理解 。 当 然 ， 有 些 人 可 能 会 说 ， 在 一 个 问题 解决 之 前 是 不 可 能 真正 理解 这 个 问 
题 的 ， 这 仅仅 表明 问题 无 法 解决 是 由 于 缺乏 对 问题 的 理解 。 因 此 ， 坚 持 在 提出 任何 解决 方案 之 
前 必须 对 该 问题 有 完全 理解 的 想法 看 起 来 有 些 过 于 理想 化 。 

作为 一 个 例子 ， 我 们 考察 下 列 问题 ; 

定 素 担 了 确认 己 的 3 个 孩子 的 年 龄 的 任务 。 己 告诉 甲 3 个 孩子 的 年 龄 乘积 是 36。 在 
考虑 了 这 个 线索 以 后 ， 甲 要 求 乙 给 出 另外 的 线索 ， 于 是 乙 告 诉 甲 3 个 孩子 的 年 龄 之 和 。 

虫 骨 次 要 求 乙 给 出 其 他 线索 ， 己 告诉 甲 他 的 最 大 的 一 个 孩子 弹 钢琴 ， 在 得 到 这 个 线索 

之 后 ， 甲 得 到 了 己 的 3 个 孩子 的 年 龄 。 

乙 的 3 个 孩子 的 年 龄 分 别 是 多 少 ? 

乍 一 看 ， 最 后 一 个 线索 看 起 来 与 问题 完全 没有 关系 。 但 是 显然 ， 正 是 因为 这 条 线索 ， 甲 最 后 确 
定 了 3 个 孩子 的 年 龄 。 这 是 为 什么 呢 ? 让 我 们 制定 一 个 计划 并 且 进 行 这 个 计划 ， 尽 管 我 们 对 于 
这 个 问题 还 有 很 多 疑问 。 我 们 的 计划 是 跟踪 问题 陈述 所 描述 的 步骤 ， 同 时 在 这 个 进程 中 记录 对 
甲 有 用 的 信息 。 

第 一 条 线索 告诉 甲 ，3 个 孩子 的 年 龄 之 积 是 36。 这 意味 着 表述 3 个 年 龄 数值 的 三 元 组 肯定 
是 图 5-5a 中 列 出 的 三 元 组 之 一 ， 第 二 条 线索 是 期 望 得 到 三 元 组 内 3 个 数字 之 和 。 我 们 并 不 知道 
这 个 和 到 底 是 多 少 ， 但 是 已 经 告诉 我 们 ， 这 个 信息 并 不 足以 让 甲 得 到 正确 的 三 元 组 ， 所 以 期 户 
得 到 的 三 元 组 的 和 在 图 $-$b 中 的 表 里 面 至 少 出 现 了 两 次 。 但 是 此 处 只 有 (1, 6, 6) 和 (2, 2 多 具有 
相同 的 和 ， 这 两 组 数字 的 和 均 是 13。 当 给 出 最 后 一 条 线索 的 时 候 ， 我 们 最 终 理解 了 最 后 一 条 线 
索 的 重要 性 。 这 个 信息 与 弹 钢琴 本 身 没 有 什么 关系 ， 而 是 说 明了 只 有 一 个 孩子 年 龄 最 大 的 事实 。 
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这 条 线索 将 三 元 组 (1, 6, 6) 排 除 并 且 最 终 得 到 结论 ， 就 是 3 个 孩子 的 年 龄 分 别 是 2、2 和 日 






(1,.1.36) (166) 1+1+36=38 ] 二 和 + 提 = 13 
(1,218) (2.2.9) 1+2+18=21 2+2+9=13 
(1.3,12) (236) 1+3+12=16 2+3+6=11 
(人 1.49 (1334) 1+4+9=14 3+3+4=10 
(a) 乘积 为 36 的 三 元 组 (b) a 中 每 个 三 元 组 的 和 








图 5-5 ”计算 过 程 


企 这 个 例子 中 ， 直 到 我 们 党 试 实施 解决 问题 的 计划 《第 3 阶段 ) 的 时 候 ， 才 获得 对 这 个 问 
古 的 完全 理解 《第 1 阶段 )。 如 果 我 们 坚持 要 首先 完成 第 1 阶段 ， 我 们 可 能 根本 得 不 到 问题 的 答 
案 。 这 种 解决 问题 过 程 中 的 不 规则 性 是 开发 问题 求解 的 系统 方法 的 基础 。 

刀 外 一 个 不 规则 性 在 于 ， 那 些 还 没有 得 到 明显 成 功 的 问题 解决 者 所 得 到 的 神奇 灵感 可 能 让 
完成 其 他 任务 的 时 候 突然 成 为 了 轧 来 问题 的 一 个 解决 方法 。H. von Helmholtz 早 在 1896 年 就 发 
加 了 这 和 现象 ， 并 且 数 学 家 庞 加 莱 〈Henri Poincar6) 在 巴黎 对 心理 学 会 的 一 次 演讲 中 对 此 进行 
了 村 论 。 在 这 个 演讲 中 ， 庞 加 菜 叙述 了 他 在 解决 一 个 问题 时 所 得 到 的 经 验 ， 他 将 原来 的 问题 放 
在 一 边 儿 ， 开 始 做 其 他 工作 之 后 ， 他 突然 意识 到 原来 问题 的 一 个 解决 方法 。 这 种 现象 反映 出 这 
秆 一个 过 程 ， 在 这 个 过 程 中 ， 大 脑 在 潜意识 部 分 好 像 一 直 在 思考 这 个 问题 ， 如 果 成 功 ， 便 会 把 
饼 次 方法 反映 给 大 脑 的 有 意识 部 分 。 今 天 ， 我 们 把 在 对 于 问题 的 有 意识 的 工作 与 突然 的 灵感 之 
间 的 这 个 时 期 称 作 沉思 期 ， 对 于 这 个 时 期 的 理解 仍旧 是 当前 研究 的 目标 


5.3.2 入 门 


前 面 ， 我 们 已 经 从 一 些 心理 学 的 观点 讨论 了 问题 求解， 但 是 回避 了 直接 对 质 这 样 的 一 个 问 
题 : 我 们 求解 问题 应 该 如 何 去 做 。 当 然 有 很 多 问题 求解 的 方法 ， 每 一 种 方法 都 可 能 在 某 些 场合 
获得 成 功 。 我 们 将 简要 地 介绍 其 中 一 些 方法 。 目 前 ， 我 们 注意 到 这 些 技术 中 贯穿 着 一 条 普遍 的 
线索 ， 人 简单 地 说 就 是 要 “入 门 ”。 作 为 一 个 例子 ， 让 我 们 考虑 下 面 这 个 简单 问题 。 


在 甲 、 乙 、 丙 和 了 丁 进 行 赛 哆 之 前 ， 他 们 分 别 对 结果 进行 预测 ， 

甲 顽 测 乙 将 会 获胜 ; 

乙 预 测 丁 将 是 最 后 一 名 ; 

内 预测 甲 是 第 三 名 ; 

了 预测 甲 的 预测 将 是 正确 的 。 

这 几 个 预测 只 有 一 个 是 正确 的 ， 并 且 是 最 后 的 获胜 者 做 出 的 预测 ， 给 出 甲 、 之 、 丙 、 丁 赛 哆 的 

名 族 排序 。 

在 阅读 了 这 个 问题 并 且 对 数据 进行 分 析 之 后 ， 我 们 很 快 就 可 以 认识 到 ， 因 为 甲 和 丁 的 预测 
是 等 价 的， 而 只 有 一 个 人 的 预测 正确 ， 所 以 这 两 个 预测 都 是 错误 的 。 因此 甲 和 了 丁 都 不 是 胜利 者 。 
在 这 一 点 上 我 们 已 经 进入 了 这 个 问题 ， 并 且 我 们 发 现 ， 获得 完整 的 解决 方法 的 过 程 仅 仅 是 将 我 
人 的 知识 在 此 处 扩展 应 用 。 如 果 甲 的 预测 错误 ， 那 么 ， 乙 也 不 是 胜利 者 。 这 样 就 只 剩 下 了 一 个 
选择 ， 就 是 两 是 胜利 者 。 因 此 ， 内 的 预测 是 正确 的 。 从 而 ， 我 们 知道 甲 是 第 三 名 。 这 就 意味 着 
最 后 的 比赛 名 次 是 两 、 乙 、 甲 、 丁 ， 或 者 丙 、 本 、 甲 、 乙 。 但 是 前 者 被 排除 了 ， 因 为 乙 的 预测 
肯定 是 错误 的 。 因 此 最 后 的 顺序 是 ; 两 、 丁 、 甲 、7 ， 

当然 ， 知道 怎样 进入 问题 并 不 等 于 知道 如 何 去 做 这 件 事 。 为 了 得 到 立足 点 ， 也 就 是 认识 到 
如 何 把 对 于 问题 的 初始 介入 扩展 为 问题 的 解决 方法 ， 就 为 了 本 求 问题 解决 者 创造 一 个 可 能 的 入 口 。 
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对 于 如 何 入 门 波 利 亚 和 其 他 人 提出 了 很 多 通用 的 方法 ， 其 中 的 一 个 是 反方 向 解决 问题 。 比 如 ， 
如 采 问 题 是 找到 对 于 一 个 已 知 输入 产生 一 个 特定 的 输出 ， 我 们 可 以 从 输出 开始 ， 然 后 反 向 到 达 
输入 。 这 个 方法 就 是 人 们 在 解决 本 节 前 面 的 学 习 受 纸 鸟 的 基本 思路 。 我 们 把 一 个 已 经 完成 的 纸 
乌 拆 开 来 ， 然 后 看 看 如 何 能 将 它 折 好 就 可 以 了 。 

久 一 个 通用 的 解决 问题 的 方法 是 寻找 一 个 相关 的 、 解 决 起 来 较 简单 的 并 且 在 此 以 前 已 经 得 
到 解决 的 问题 ， 然 后 尝试 把 这 个 解决 方法 用 到 当前 问题 中 。 这 个 技术 在 程序 开发 中 是 有 特殊 价 
值 的 。 通 常 ， 程 序 开发 并 不 是 去 解决 一 个 问题 的 一 个 特定 实例 ， 而 是 要 去 寻找 一 种 适用 于 求解 
一 个 问题 的 所 有 实例 的 一 般 算 法 。 更 加 准确 地 讲 ， 如 果 我 们 面 对 -- 个 要 把 姓名 表 按 照 字 母 排 序 
的 程序 开发 任务 时 ， 我 们 的 任务 并 不 是 只 给 一 个 特定 的 表 排 序 ， 而 是 寻找 一 个 可 以 被 用 来 给 任 
何 名 单 排序 的 通用 算法 。 因 此 ， 尽 管 指令 

变换 名 字 David 和 Alice。 

将 名 字 Carol 移 到 Alice 和 David 之 间 

将 名 字 Bob 移 到 Alice 和 Carol 之 间 。 

可 以 把 由 David、Alice、Carol 和 Bob 组 成 的 名 单 正确 排序 , 但 这 并 不 是 我 们 需要 的 通用 的 算法 。 
我 们 需要 的 算法 既 可 以 为 这 个 名 单 排序 ， 又 可 以 为 它 遇 到 的 其 他 名 单 排序 。 这 并 不 是 说 我 们 为 
特定 表 排 序 的 算法 在 我 们 研究 通用 算法 的 过 程 中 是 完全 没有 意义 的 。 例 如 ， 我 们 可 以 通过 考虑 
一 人 小 特殊 的 情况 来 进入 问题 ， 然 后 得 到 一 个 能 够 用 于 开发 通用 算法 的 一 般 原 则 。 然 后 ， 在 这 种 
情况 中 ， 我 们 解决 问题 的 方法 可 以 从 对 于 多 个 相关 问题 的 解决 中 得 到 。 

为 外 一 个 进入 问题 的 方法 是 逐步 求 精 (stepwise refinement)， 这 种 方法 本 质 上 不 是 试图 立即 
解决 整个 问题 ， 而 是 把 一 个 手头 的 问题 看 作 多 个 子 问题 。 我 们 可 以 按照 步骤 通过 解决 各 个 子 问 
题 来 最 后 解决 整个 问题 ， 其 中 每 一 步 都 比 解决 完整 的 问题 要 更 容易 。 逐 步 求 精 的 方法 还 可 以 把 
这 些 步 骤 划 分 成 更 小 的 步 台 ， 然 后 这 些 更 小 的 步骤 还 可 以 继续 进行 划分 ， 直 到 整个 问题 被 简化 
为 一 组 简单 的 子 问题 为 止 。 

从 这 反 看 来 ， 逐 步 求 精 是 一 种 自 项 向 下 方法 〈top-down methodology)， 这 种 方法 从 一 般 改 
展 到 特殊 。 相 反 ， 自 底 向 上 方法 〈bottom-up methodology) 是 从 特殊 发 展 到 一 般 。 尽 管理 论 上 
相 友 ， 但 是 实际 上 这 两 种 方法 在 应 用 中 互 为 补充 。 比 如 ， 逐 步 求 精 的 自 顶 向 下 方法 分 解 问题 通 
间 是 由 那些 从 事 自 底 向 上 工作 的 解决 问题 的 人 提出 的 。 

称 步 求 精 的 自 顶 向 下 方法 从 本 质 上 讲 是 一 种 组 织 工具 ， 这 种 工具 解决 问题 的 属性 是 组 织 方 
却 的 结果 。 逐 步 求 精 早已 成 为 数据 处 理 中 一 个 重要 的 设计 方法 ， 在 那里 软件 开发 项 目 拥有 一 个 
很 大 的 组 织 模块 。 但 就 像 我 们 将 要 在 第 7 章 中 学 习 的 ， 大 的 软件 系统 更 多 地 通过 结合 预先 编制 
的 部 件 完成 《本 质 上 是 一 种 自 底 向 上 的 方法 )， 因 此 自 顶 向 下 和 目 底 向 上 的 方法 仍然 是 计算 机 科 
学 中 重要 的 工具 。 

之 所 以 维持 如 此 宽广 的 观点 是 基于 以 下 的 一 个 事实 ， 即 将 预想 的 符号 和 预选 的 工具 带 入 问 
题 求 解 任务 中 ， 有 时 候 可 能 掩盖 问题 的 简单 性 。 本 节 前 面 讲 的 求解 3 个 孩子 年 龄 的 问题 就 是 这 
种 现象 的 一 个 很 好 的 例子 ， 学 习 代 数 的 学 生 解 决 问题 不 变 的 方法 就 是 给 出 系统 的 联 立 方程 ， 这 
种 方法 可 能 将 问题 带 入 死路 ， 而 且 使 得 问题 解决 者 误 认为 并 没有 足够 的 信息 来 解决 问题 ， 

万 外 再 给 出 一 个 类 似 的 例子 : 

当 你 从 码头 走 上 船 的 时 候 ， 帽 子 掉 进 了 水 里 ， 但 是 你 并 不 知道 。 河 水 的 流速 是 4 

公里 /小 时 ， 所 以 帽子 开始 向 下 游 漂 去 。 同 时 ， 体 开始 以 相对 于 水 流 7.6 公 里 /小 时 的 速 

度 向 上 游 前 进 。10 分 钟 后 ， 你 发 现 蛋子 不 见 了 ， 然 后 调转 船 头 ， 开 始 追 你 的 巾 子 ， 试 

问 你 多 长 时 间 可 以 找到 帽子 ? 


kw 
, 尼 


ka 
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六 多 数学 习 代数 的 学 生还 有 那些 使 用 计算 器 的 人 在 解决 这 个 问题 的 时 候 ， 首 先 会 确定 船 在 
10 分 钟 后 向 上 游行 进 了 多 远 以 及 在 相同 时 间 内 帽子 向 下 游 漂 了 多 远 。 然 后 ， 他 们 确定 船 将 使 用 
多 少时 间 赶 上 帽子 。 但 是 ， 当 船 到 达 这 个 位 置 的 时 候 ， 帽 子 将 继续 向 下 游 流 去 。 因 此 ， 问 题解 
决 者 要 么 就 是 用 微分 的 方法 重新 解 题 ， 要 么 就 陷入 到 计算 每 次 船 到 达 一 个 位 置 的 时 候 帽子 所 处 
的 位 置 这 样 一 个 圈子 里 。 

蕉 实 问 题 很 简单 。 这 里 的 失误 在 于 解 题 者 忙于 列 出 公式 并 进行 求解 。 其 实 ， 我 们 需要 先 将 
技术 放 在 一 边 ， 并 且 调整 我 们 对 于 问题 的 观点 。 整 个 问题 发 生 在 河中 。 事 实 是 水 的 流动 与 河岸 
生 个 相关 的 。 想 象 一 个 相同 的 问题 发 生 在 传送 带 上 而 非 水 中 。 首 先 ， 在 传送 带 停止 的 情况 下 解 
次 问题 。 如 果 你 站 在 传送 带 上 ， 然 后 把 你 的 帽子 放 在 脚下 ， 之 后 反 向 行走 10 min， 那 么 将 消耗 
10 min 赶 上 你 的 帽子 。 现 在 启动 传送 带 ， 这 意味 着 旁边 的 场景 将 相对 于 传送 带 反 向 运动 起 来 。 
但 是 ， 因 为 你 站 在 传送 带 上 ， 这 就 不 会 改变 你 和 传送 带 或 者 你 的 帽子 之 间 的 相对 关系 ， 所 以 仍 
会 使 用 10 min 回 到 你 放 帽子 的 地 方 。 

我 们 可 以 得 到 这 样 一 个 结论 : 算法 的 发 现 仍旧 是 一 种 富有 挑战 的 艺术 性 工作 ， 这 项 工作 必 
级 化 费 一 定时 间 才 可 以 完成 ， 而 不 能 像 一 门 由 意义 明确 的 方法 组 成 的 事物 那样 学 到 。 因 此 ， 机 
破 地 跟随 一 定 的 方法 来 训练 未 来 的 问题 解决 者 就 是 在 压制 那些 本 来 应 该 被 灵活 地 培养 出 来 的 创 
造 性 技能 。 


问题 与 练习 

1 a， 村 找 一 个 算法 求解 下 面 的 问题 ， 已 知 一 个 正 整数 nm， 寻找 个 正 整 数 表 ， 该 袁 中 所 有 正 整 数 的 磁 积 
征 其 和 为 m 的 所 有 正 整数 列表 中 最 大 的 。 例 如 ， 如 果 产 为 4， 那么 所 求 的 表 由 两 个 2 组 成 ， 因 为 2X2 
大 于 1X1Xx1Xx1l，1Xxtx2 和 1X3。 如 颗 为 5， 则 所 求 的 表 由 2 和 3 组 成 。 

. 如 果 H=2001， 那 么 所 求 的 表 由 哪些 数字 组 成 ? 

说明 你 恕 何 “ 人 入 门 ” 这 个 问题 的 。 

忆 民 已 知 咒 棋 棋盘 由 2“ 行 和 每 行 2 列 组 成 ， 给 定 正 整数 mn， 以 及 一 - 盒 L 型 棋子 ， 每 一 个 都 恰好 可 避 
得 柚 模 盘 的 三 个 正方 形 格子 。 如 果 任 何 一 个 格子 从 棋盘 上 被 切 掉 ， 我 们 是 否 还 可 以 用 这 些 棋子 在 
怒 不 互 相 重 登 ， 又 不 跨越 棋盘 边 的 条 件 下 把 剩余 的 棋盘 填 满 ? 

b. 请 说 明 怎样 用 问题 a 的 解 来 证 明 ， 对 于 所 有 的 正 整数 m， 2 -1 是 可 以 被 3 除 尽 的 。 
5. 问题 a 和 问题 b 是 否 与 波 利 亚 的 问题 求解 步骤 相符 合 ? 
3. 解码 下 面 的 消息 ， 并 解释 你 是 如 何 入 门 的 。 
Pdeo eo pda yknnayp wjosan ， 
4. 如 果 你 打算 解决 拼图 游戏 问题 ， 即 把 图 片 撤 散 在 桌面 上 然后 将 其 拼 出 完整 图 ， 你 会 采用 音 项 向 玉 的 方 
法 吗 ? 如 果 你 是 看 着 拼图 盒 上 的 完整 图 提示 来 做 ， 你 的 回答 会 改变 吗 ? 


站 和 


0 0 ee 二 让 且 于 于 PH 辣 二 -< 1 村 


5.4 迭代 结构 


我 们 现在 要 学 习 一 些 在 描述 算法 过 程 中 使 用 的 重复 结构 。 在 本 节 中 ， 我 们 讨论 选 代 结 构 
(iterative structure)。 在 这 种 结构 中 ， 一 组 指令 以 循环 方式 重复 执行 。 在 5.5 节 中 ， 我 们 将 介绍 
遍 归 技术 。 作 为 一 些 相关 联 知识 ， 我 们 将 介绍 一 些 流行 的 算法 一 一 顺序 搜索 法 、 一 分 搜索 法 和 
插入 排序 法 。 我 们 从 介绍 顺序 搜索 法 开始 。 


5.4.1 顺序 搜索 法 
二 座 _ 下 查找 某 个 特定 数值 是 否 存在 于 一 个 表 中 的 问题 。 我 们 希望 开发 一 个 算法 来 确定 这 
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个 值 是 否 在 表 中 。 如 果 它 在 甫 中， 我 们 认为 查找 成 功 ， 反 之 则 认为 查找 失败 。 我 们 假设 被 查找 
的 表 依照 某 种 规定 已 被 排序 。 例 如 ， 如 果 这 是 一 个 姓名 表 ， 我 们 假设 表 中 的 名 字 是 按照 字典 顺 
序 排 列 的 ， 如 果 这 个 表 由 数字 组 成 ， 我 们 假设 里 面 的 表 项 按照 增 序 排列 。 


音乐 中 的 和 迭代 结构 


音乐 家 比 计 算 机 科学 家 早 几 个 世纪 就 已 经 开始 使 用 和 编写 选 代 结 构 。 实 际 上 ， 一 首 歌 的 
结构 【谱写 成 多 修 小 节 ， 每 个 小 节 配 以 和 声 ) 可 以 用 while 语 外 示 范 : 


while ( 有 剩余 小 节 ) do 


{ 唱 下 一 小 节 ， 
唱和 声 ) 
而 且 
[1 [2 
0 
| 生生 的 


只 不 过 是 谱 曲 者 表达 下 面 结构 的 方式 : 
内 一 1: 
While (N<31) do 
( 演奏 该 乐曲 段 ， 
演奏 第 N 段 尾 曲 ; 
N 一 N+1) 


为 了 入 门 ,我们 想象 如 何在 一 个 大 概 有 20 条 记录 的 来 宾 表 中 寻找 一 个 特定 的 姓名 。 在 这 种 
情况 中 ， 我 们 可 以 从 头 开始 扫描 整个 表 ， 将 每 一 条 记录 与 目标 姓名 进行 比较 。 如 果 我 们 找到 了 
目标 姓名 ， 那 么 查找 就 将 以 成 功 终止 。 当 然 ， 如 果 我 们 到 达 表 的 最 后 仍然 没有 找到 目标 ， 查 找 
就 以 失败 告终 。 实 际 上 ， 如 果 我 们 到 达 了 《〈 从 字典 排序 方面 看 ) 大 于 目标 姓名 的 值 还 没有 找到 
目标 姓名 ， 那 么 我 们 的 查找 就 已 经 宣告 失败 。( 记 住 ， 表 已 经 按照 字典 顺序 排列 ， 所 以 到 达 一 个 
大 于 目标 姓名 的 表 项 就 意味 着 目标 不 可 能 在 表 中 出 现 了 .。 ) 概括 来 说 ,我 们 粗略 的 想法 是 只 要 还 
有 姓名 没 被 检查 而 且 目 标 姓名 大 于 正在 检查 的 表 项 ， 我 们 的 查询 就 将 继续 。 

在 我 们 的 伪 代 码 中 ， 这 个 过 程 可 以 表达 为 : 

选择 列表 中 的 第 一 个 表 项 作为 TestEntry 

While ( TargetValue>TestEntry 并 且 还 有 表 项 没有 检查 ) 

do ( 选择 列表 中 下 一 个 表 项 作为 TestEntry ) 
如 果 要 终止 上 面 的 while 结构 ， 则 两 个 条 件 中 有 一 个 必须 为 真 ， 或 者 目标 值 被 找到 ， 或 者 目标 
值 不 在 表 中 。 在 任何 一 种 情况 中 ， 我 们 都 可 以 通过 比较 测试 表 项 〈TestEntry) 和 目标 值 来 发 现 
得 找 是 否 成 功 。 如 果 这 两 个 值 相 等 ， 那 么 查找 就 成 功 了 。 因 此 ， 我 们 把 下 面 一 些 语句 添加 到 以 
上 伪 代 码 例 程 的 下 面 : 
if( TargetValue = TestEntry ) 


then ( 宣布 查找 成 功 ) 
else ( 宣布 查找 失败 ) 


5 


| 
Fu 
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最 后 ， 我 们 观察 这 个 例 程 的 第 一 条 语句 。 这 条 语句 把 表 中 的 第 一 条 记录 选 出 来 ， 这 种 选择 
是 基于 表 中 至 少 有 一 条 记录 这 样 的 假设 之 上 的 。 我 们 可 能 认为 这 是 一 种 安全 的 猜测 ， 但 是 为 了 
保险 起 见 ， 我 们 将 前 面 的 例 程 作 为 下 面 语句 中 的 else 部 分 ， 


放 ( 列表 空 ) 
then ( 宣布 查找 失败 ) 


else ( … ) 
这 个 过 程 的 伪 代 码 如 图 $-6 所 示 。 注 意 ， 这 个 过 程 可 以 在 其 他 过 程 中 通过 下 面 的 语句 加 以 使 用 ; 
运用 过 程 Search 于 旅客 列表 查找 名 为 Darrel Baker 的 旅客 
这 个 语句 可 以 查 明 Darrel Baker 是 否 是 一 名 旅客 ， 而 车 用 语句 ， 
利用 nutmeg 作 为 目标 值 运用 过 程 Search 于 原料 列表 
则 可 以 查 明 nutmeg《〈 肉 豆 敬 ) 是 否 出 现在 原料 列表 上 。 






procedure Search ( List,TargetValue ) 
上 f( List 空 ) 
thnen 
( 宣布 查找 失败 ) 
已 15e 
( 选择 列表 中 的 第 一 个 表 项 作为 TestEntry: 
while ( TargetValue > TestEntry 并 且 还 有 表 项 没有 检查 ) 
do ( 选择 列表 中 下 一 个 表 项 作为 TestEntry ) 
if( TargetValue = TestEntry ) 
then( 宣布 查找 成 功 ) 
else ( 宣布 查找 失败 ) 
jend 于 












留 56 擅 代 码 形式 的 顺序 搜索 算法 


概括 来 讲 ， 图 5-6 所 示 的 算法 按照 表 项 在 表 中 的 出 现 顺序 进行 查找 。 内 此 ， 这 个 算法 称 作 
顺序 搜索 (sequential search) 算法 。 因 为 其 简单 ， 所 以 顺序 搜索 法 经 常用 于 在 较 短 的 表 中 进行 
得 找 的 情况 。 在 比较 长 的 表 中 ， 顺 厅 搜 索 就 没有 (我们 将 要 学 习 的 ) 其 他 技术 有 效 了 。 


5.4.2 ”循环 控制 


一 条 指令 或 者 一 系列 指令 的 重复 使 用 是 一 个 很 重要 的 算法 概念 。 一 种 实现 这 种 重复 的 方法 
是 称 作 循环 (loop) 的 迭代 结构 。 这 种 结构 中 ， 一 组 称 为 循环 体 的 指令 在 某 些 控 制 过程 的 指引 
下 重复 执行 。 一 个 典型 的 例子 就 是 图 5-6 所 示 的 顺序 搜索 算法 。 这 里 我 们 使 用 while 语句 来 控制 
以 下 单条 语句 的 循环 ， 

选择 列表 中 下 一 表 项 作为 TestEntry 
实际 上 ，while 语 各 

while( 条 件 ) do{ 循环 体 ) 


就 是 循环 结构 的 一 个 例子 ， 它 的 执行 所 跟踪 的 循环 模式 为 ; 
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检查 条 件 。 
直到 条 件 为 假 。 

作为 一 个 普遍 规则 , 循环 结构 的 使 用 使 程序 得 到 了 比 仅 仅 将 循环 体重 写 多 次 更 高 的 灵活 度 。 
例如 ， 执 行 下 面 的 语句 3 次 ; 

执行 语句 加 一 滴 硫 酸 
等 价 于 语句 序列 

加 一 滴 硫 酸 ， 

加 一 滴 人 硫酸 ， 

加 一 滴 硫 酸 。 
但 是 我 们 写 不 出 与 下 面 的 循环 结构 等 价 的 具有 相似 结构 的 序列 ; 

while( pH 值 大 于 4 ) do 

( 加 一 滴 硫 酸 ) 

因为 我 们 事先 不 知道 需要 滴 入 多 少 硫酸 才 合 适 。 

现在 让 我 们 进一步 考查 循环 控制 的 组 成 。 你 可 能 认为 这 一 段 关于 循环 结构 的 部 分 并 不 重要 。 
毕竟 ， 这 些 循 环 体 实际 上 都 在 执行 一 些 我 们 身边 的 任务 〈 比 如 ， 加 几 滴 硫 酸 ) -一 控制 活动 看 
起 来 并 不 重要 ， 因 为 我 们 选择 在 重复 的 形式 中 执行 循环 体 。 但 是 ， 经 验 说 明 循 环 控制 是 循环 结 
构 中 一 个 非常 容易 出 现 错误 的 部 分 ， 所 以 很 值得 我 们 注意 。 

循环 控制 由 初始 化 、 测 试 和 修改 〈 如 图 5-7 所 示 ) 3 个 活动 组 成 ， 其 中 每 一 个 活动 都 决定 了 
循环 是 否 能 够 成 功 。 测 试 活动 拥有 通过 查看 表明 终止 的 条 件 是 否 发 生来 引起 循环 过 程 终 止 的 责 
任 。 这 个 条 件 就 是 终止 条 件 〈termination condition)。 为 了 这 个 测试 活动 ， 我 们 在 伪 代 码 的 每 一 个 
while 语句 中 都 提供 一 个 条 件 。 在 while 语句 中 ， 循 环 体 必须 在 阐明 的 条 件 下 执行 一 终止 条 件 就 
是 while 结构 中 出 现 的 条 件 的 对 立 条 件 情 况 。 因 此 ， 在 语句 

while ( pPH 值 大 于 4 ) do 

( 加 一 滴 硫 酸 ) 


中 ， 终 止 条 件 是 “pH 值 不 大 于 4”， 在 图 5-6 所 示 的 while 语 句 中 ， 终 止 条 件 是 ， 
(目标 值 生 测试 项 ) 或 〈 不 再 有 要 检查 的 表 项 ) 


初始 化 :设置 一 个 初始 状态 ， 这 一 状态 可 以 被 修改 直至 终止 条 件 
测试 : 比较 当前 状态 和 终止 条 件 ， 如 果 相 等 则 终止 循环 


修改 : 修改 状态 使 之 可 以 达到 终止 条 件 
图 5-7 ”可 重复 结构 控制 的 组 成 





循环 控制 中 的 另外 两 个 活动 确保 了 终止 条 件 最 终 可 以 出 现 。 初 始 化 步骤 建立 了 一 个 开始 条 
件 ， 修 改 步骤 将 这 个 条 件 移 向 终止 条 件 。 比 如 ， 在 图 5-6 中 ,初始 化 发 生 在 while 语句 之 前 的 语 
名 中 。 该 处 ， 当 前 的 测试 表 项 被 设 定 为 表 的 第 一 条 记录 。 在 这 个 例子 中 ， 修 改 步骤 实际 上 是 在 
循环 体内 完成 的 ， 在 循环 体 中 ， 我 们 将 测试 位 置 〈 也 就 是 测试 表 项 ) 向 表 的 末尾 移动 。 因 此 ， 
在 执行 完 初始 化 步 邓 后 ,修改 步 骤 的 重复 执行 最 终 使 得 程序 可 以 到 达 终止 条 件 。( 或 者 我 们 到 达 
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一 条 大 于 或 等 于 目标 值 的 测试 项 ， 或 者 我 们 到 达 表 的 末尾 。) 

我 们 应 该 强调 的 是 初始 化 和 修改 步骤 必须 导致 合适 的 终止 条 件 。 这 个 特性 非常 严格 ， 因 此 
在 设 计 循环 结构 的 时 候 必须 仔细 检查 它 的 存在 。 如 果 没 有 进行 相应 的 检查 就 有 可 能 使 得 在 最 简 
单 的 例子 中 都 会 发 生 错 误 。 一 个 典型 的 例子 就 是 ， 


Number 一 1; 
while (Nurmber 天 6) do 
(INumber 一 Number +D) 
这 里 ， 终 止 条 件 是 “Number=6”。 但 是 Number 初始 化 为 1， 并 且 每 次 修改 的 时 候 都 加 2。 因 此， 
在 循环 过 程 中 ，Number 的 值 将 是 1、3、5、7、9 等 ， 但 是 永远 不 会 是 6， 这样， 循环 就 无 法 终 小 。 
循环 控制 部 件 的 执行 次 序 可 产生 微妙 的 结果 。 事 实 上 ， 有 了 两 种 常用 的 循环 结构 ， 它 们 仅仅 
在 循环 控制 部 件 执行 次 序 上 有 所 区 别 。 第 一 个 就 是 以 下 伪 代 码 语句 所 示 : 


while ( 条 件 ) do ( 活动 ) 
这个 结构 的 语义 由 图 5-8 中 的 流程 图 (flowchart) 给 出 。( 流 程 图 使 用 各 种 形状 来 表达 单个 步骤 
和 并且 用 箭头 表达 步骤 的 顺序 。 线 框 形状 之 间 的 不 同 表示 所 包含 的 相关 步骤 不 同 ， 比 如 蓉 形 表示 
判断 而 息 形 表示 任意 语句 和 语句 序 列 。) 注意 ，while 结构 的 终止 测试 出 现在 循环 体 执行 之 前 。 
相反 ， 图 5-9 中 所 示 的 结构 要 求 循环 体 在 终止 条 件 测试 之 前 执行 。 在 这 种 情况 下 ， 循 环 体 


有 加 是 至 少 被 执行 一 次 ， 然 而 在 while 结构 中 ， 如 打 终 止 条 件 在 第 一 次 测试 时 就 满足 ， 则 循环 体 


一 族 都 不 用 执行 。 
条 忻 为 假 1 
一 济 试 条 件 一 ] 沪 动 
| 条 人 忻 为 真 | 
国人 -会 
人 活动 尝 件 为 候 
和 件 为 真 
| | 
图 $-8 while 循环 结构 图 $-9 repeat 循环 结构 
我 们 用 语法 格式 


repeat ( 活动 ) until ( 条 件 ) 

在 伪 代 码 中 表示 图 5$-9 所 示 的 结构 。 因 此 ， 语 名 
repeat ( 从 你 口 绕 里 面 取出 一 个 硬币 ) 
until ( 你 口 伐 里 没有 硬币 ) 

假设 开始 时 ， 在 你 的 口 伐 中 至 少 有 一 个 硬币 ， 但 是 用 
while ( 你 口 绕 里 面 有 硬币 ) do 
( 从 你 口 绕 里 取出 一 个 硬币 ) 

就 不 用 再 限定 必须 至 少 有 一 枚 厅 币 。 
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依照 伪 代码 的 术语 ， 我 们 通常 会 把 这 些 循 环 称 作 while 循环 结构 或 者 repeat 循环 结构 。 在 
更 一 般 的 情况 下 ， 你 可 能 已 经 知道 ， 有 时 候 我 们 用 前 测试 循环 (pretest loop) 一 词 来 表示 while 
循环 结构 〈 因 为 终止 条 件 的 检查 是 在 执行 循环 体 之 前 执行 的 )， 而 把 repeat 箱 环 结构 称 作 后 测 
试 循环 (posttest loop) 〈 因 为 终止 条 件 的 检查 发 生 在 执行 循环 体 之 后 )。 


5.4.3 ”插入 排序 算法 


作为 另外 一 个 选 代 结构 的 例子 ， 下 面 考查 将 一 组 姓名 按照 字典 顺序 进行 排序 的 问题 。 但 十 
在 继续 介绍 之 前 ， 我 们 应 该 能 够 认识 到 排序 的 限制 。 简 单 来 讲 ， 我 们 的 目标 是 在 一 个 表 的 内 部 
将 表 项 进行 排序 ， 我 们 想 通过 把 表 项 移 来 移 去 来 将 列表 排 好 序 ， 而 不 是 把 列表 移 到 其 他 位 置 。 
我 们 的 情况 类 似 于 这 样 的 列表 排序 问题 : 每 个 表 项 记录 在 一 张 索引 卡片 上 , 卡 卢 分 若 在 果 面 上 ， 
把 桌面 挤 得 满 满 的 。 我 们 已 经 清理 出 足够 的 空间 来 放 这 些 卡 片 ， 但 是 不 允许 挪 开 其 他 东西 来 挤 
出 更 多 的 空间 。 这 种 限制 在 计算 机 应 用 里 是 很 典型 的 ， 其 原因 当然 不 是 计算 机 里 的 工作 空间 一 
定 像 我 们 的 桌面 那样 拥挤 ， 而 仅仅 是 因为 我 们 希望 更 有 效 地 利用 存储 空间 。 

” ”让 我 们 从 考虑 如 何在 这 样 一 个 桌面 上 进行 排序 来 “入门 ”考虑 一 个 名 字 表 : 

Fred 

和 太 ]eX 

Dilana 

Byron 

(Larol 
一 个 方法 是 每 次 只 对 这 个 表 中 的 一 个 子 表 进 行 排序 。Fred 在 表 的 最 顶部 ， 现 在 只 看 他 和 Alex。 
因此 我 们 只 要 拿 出 包含 姓名 Alex 的 卡片 ， 将 Fred 放 到 她 留 干 的 空缺 处 ， 然 后 把 Alex 放 到 Fred 
原来 的 位 置 ， 如 图 $-10 第 1 行 所 示 。 这 样 名 字 表 了 束 变 成 了 

Alex 

Fred 

Diana 

Byron 

(Larol 

现在 ， 顶 部 的 两 个 名 字 构 成 了 一 个 已 经 排序 的 子 表 ， 但 是 最 顶部 的 3 个 名 字 还 不 是 。 因 此 ， 
我 们 可 以 取出 第 3 个 名 字 Diana， 然 后 将 Fred 移动 到 Diana 拿 走 后 留 下 的 空白 处 ， 然 后 将 Diana 
放 入 Fred 原来 所 在 的 位 置 ， 如 图 $-10 中 第 2 行 所 示 。 最 顶部 3 条 记录 已 经 排 好 序 了 。 继 续 这 
个 操作 ， 通 过 取出 第 4 个 姓名 Byron， 然后 把 Fred 和 Diana 下 移 同 时 将 Byron 捕 人 空缺 处 ， 就 

“人 够 获得 最 顶部 4 个 记录 均 被 排序 的 表 了 〈 请 看 图 的 第 3 行 )。 最 后 ， 我 们 通过 取出 Carol， 然 
后 把 Fred 和 Diana 下 移 ， 同 时 把 Carol 放 入 空缺 来 完成 排序 工作 《参见 图 $-10 的 第 4 行 )。 

在 分 析 了 一 个 特殊 表 的 排序 过 程 之 后 ， 现 在 的 任务 是 将 这 个 过 程 通用 化 ， 以 获得 对 一 般 列 
表 排 序 的 算法 。 为 了 达到 这 个 目的 ， 我 们 考查 图 $-10 中 的 每 一 行 ， 发 现 它们 部 执行 同样 的 通用 
的 过 程 : 取出 表 中 还 未 排序 的 部 分 中 的 第 1 个 名 字 ， 将 已 经 排序 的 部 分 中 大 于 此 名 字 的 表 项 同 
后 移 ， 然 后 将 这 个 名 播 入 到 这 一 部 分 的 空缺 处 。 如 果 把 得 到 的 名 字 称 为 主 元 《pivot)， 那 么 这 个 
过 程 可 以 用 下 面 的 伪 代 码 表示 : 

把 主 元 表 项 移 到 一 个 临时 位 置 使 该 列表 留 出 一 个 空位 置 

while ( 如 果 这 个 定位 置 上 面 存在 一 个 名 字 并 且 那 个 名 字 比 主 元 大 ) do 

( 把 这 个 名 字 向 下 移 到 空位 置 上 使 该 名 字 上 面 留 出 一 个 空位 置 ) 

把 主 元 项 播 到 列表 的 空位 置 上 
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初始 列表 世 
已 排序 二 | Fred Fred | 证 [ RiSX ] 
本 










| Alex |4{[ |] 
一 血 


_Fred | 

























二 人。 [全 亚 9  [ 克 . 硬 查 
一 和 一 和 Fred 一 和 | Fred 















Alex | Alex ] 十 [ 芭 vrOR 抽 Lex Byvron 1ex 
| | on 由 | 全 
Fred | = 一 CDiana 一 一 | Diana 
CR Fred 
Alex | lex [Carol] 内 lex / 僵 国 四 
已 排序 Byronj Byvron Byron 1 
Diana | em- | Diana ”=- 4 于 汪汪 轴 = 人 | Carol 
Fred Fred Diana Diana 
避 Fred Fred 








已 排序 列表 ， 
Byron 
必 司 FG| 


Fred 
图 5-10 ” 按 字 母 顺 序 为 Fred、Alex、Diana、Byron 和 Carol 排 序 


下 一 步 ， 我 们 来 观察 这 个 过 程 怎样 被 重复 执行 。 为 了 开始 排序 过 程 ， 主 元 项 应 该 是 列表 的 
第 2 项 。 然 后 每 当 再 执行 一 次 前 ， 主 元 项 的 选择 应 该 是 从 列表 中 的 下 个 位 置 直 到 列表 的 最 后 一 
个 位 置 。 也 就 是 说 ， 随 着 前 面 的 程序 的 重复 ， 主 元 项 的 位 署 从 第 2 项 移 进 到 第 3 项 ， 然 后 到 第 
4 项 ， 依 次 类 推 ， 直 到 程序 定位 到 表 的 最 后 一 项 。 我 们 使 用 下 面 的 语句 对 这 个 过 程 进行 控制 ， 

N 一 2 

while ( N 的 值 不 超过 列表 的 长 度 ) do 

( 把 列表 的 第 N 项 作为 主 元 项 ; 


(N 一 +T) 
习 里 ，N 表示 主 元 项 的 位 置 ， 列 表 的 长 度 是 指 列表 中 的 项 个 数 ， 而 省 略 号 则 是 指 放置 前 面 例 程 
的 位 置 。 


完整 的 伪 代码 程序 如 图 5-11 所 示 。 简 言 之 ， 这 个 程序 通过 重复 地 移动 表 项 并 且 将 其 插入 适 
当 的 位 置 来 完成 排序 。 由 于 这 种 重复 的 插入 过 程 ， 这 种 算法 成 为 插入 排序 〈insertion sort。 
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procedure Sort(List) 
N 一 2， 
while ( N 的 值 不 超过 列表 的 长 度 ) do 
( 把 列表 的 第 N 项 作为 主 元 项 ; 
把 主 元 项 移 到 一 个 临时 位 置 使 该 列表 留 出 一 个 空位 置 : 


While ( 如 果 这 个 空位 置 上 面 存在 一 个 名 字 并 且 那 个 名 字 比 主 元 大 ) do 
( 把 这 个 名 字 向 下 移 到 空位 置 上 使 该 名 字 上 面 留 出 一 个 空位 置 ) 

把 主 元 项 播 到 列表 的 空位 置 上 ; 

N 一 人 +] 





图 5-11 用 擅 代 码 表达 的 插入 排序 算法 


注意 ， 图 5-11 中 所 示 的 结构 是 一 个 循环 内 部 还 有 循环 的 结构 ， 外 屋 循 环 用 第 一 个 while 语 
名 表述 ， 而 内 层 循环 用 第 二 个 while 语句 表述 。 每 次 执行 外 层 循 环 体 都 导致 内 层 循环 体 被 初始 
化 而 且 重复 执行 直到 终止 条 件 出 现 ， 因 此 外 层 循 环 体 的 一 次 执行 将 导致 内 层 循环 体 多 次 执行 。 

外 层 循环 控制 的 初始 化 部 分 通过 使 用 赋值 语句 N 一 2; 实现 。 修 改 部 分 通过 每 次 给 N 加 1( 语 
合 NN+1) 完成 。 终 止 条 件 当 N 的 值 超过 表 的 长 度 时 出 现 。 

内 层 循环 控制 通过 移动 主 元 项 并 且 创建 一 个 空缺 位 置 来 初始 化 。 循 环 的 修改 步骤 通过 移动 
表 项 到 空位 置 来 实现 ， 因 此 导致 空位 置 上 移 。 终 止 条 件 在 空位 置 被 主 元 项 填充 的 时 候 出 现 。 


但 找 和 排序 


顺序 搜索 算法 和 二 分 搜索 算法 仅 是 许多 实现 排序 过 程 的 算法 中 的 两 个 ， 同 样 ， 插入 排序 
是 许多 排序 萌 法 中 的 一 个 .其 他 经 典 的 排序 算法 包括 归并 排序 ( 见 第 12 章 )、 选择 排序 ( 见 54 
节 问 题 与 练习 6)、 冒 池 排 序 ( 见 5.4 节 问题 与 练习 7 小 快 序 排序 ( 对 排序 过 程 采取 分 治 的 方法 ) 
和 扒 排 序 (使 用 一 种 巧妙 的 技术 ， 可 以 在 列表 里 找到 应 该 向 前 移 的 表 项 ) 有 闫 这 些 算法 的 讨 
论 可 以 参阅 本 章 末 的 “课外 阅读 ”里 面 列 出 的 书目 。 


问题 与 练习 
1. 企 改 图 5-6 中 的 顺序 搜索 过 程 ， 司 其 可 用 于 未 排序 的 表 。 
2. 把 下 面 的 伪 代 码 转换 为 等 价 的 用 repeat 语 名 表述 的 程序 ， 
二 二 站: 
此 一 ] 
While 作 <6)do 
《之 一 之 十 其 
其 二 其 十 ] 
3. 当今 一 些 流 行 的 程序 设计 语言 使 用 语法 。 
While (...) 台 D 1...) 
来 表示 前 测试 循环 ， 而 用 
寺 D (...) while (...) 
表示 后 测试 循环 。 尽 管 设计 上 显得 很 优雅 ， 但 是 这 种 相似 的 形式 会 导致 什么 问题 ? 
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4. 假设 图 5-11 所 示 的 插入 排序 算法 用 来 对 表 Gene、Cheryl、 Alex 和 Brenda 进 行 排 序 。 摘 述 外 层 while 结 
构 的 循环 体 的 每 次 执行 结束 时 表 的 构成 。 

:为 什么 不 能 把 图 5-11 中 while 语 句 内 的 “大 于 ” 改 为 “大 于 等 于 ”? 

6. 插入 排序 的 一 个 变种 是 选择 排序 (selection sort)。 此 排序 法 从 选择 表 中 最 小 的 项 并 将 其 称 至 玫 的 最 前 
面 开 好。 然后 选择 表 中 的 剩余 项 中 最 小 的 项 ， 同 时 将 其 放 到 表 的 第 二 个 位 置 。 通 过 重复 从 表 的 翻 祭 部 
分 选择 最 小 的 项 ， 经 过 排序 的 部 分 便 从 前 向 后 逐渐 变 长 ， 而 后 面 未 排序 的 部 分 逐渐 缩短 。 使 用 我 们 的 
伪 代 码 来 表达 用 选择 排序 法 实现 的 类 似 于 图 $-11 中 的 列表 排序 过 程 。， 

- 习 一 个 善 名 的 排序 算法 是 贸 泡 排序 (bubble sort)。 这 个 算法 基于 这 样 一 种 机 制 : 重复 对 表 中 相 邻 的 两 
项 进行 比较 ， 如 果 它 们 并 不 是 依照 规定 排序 的 就 交换 它们 的 位 置 。 我 们 假设 等 待 排序 的 表 有 nm 项 。 冒 
入 排序 法 将 从 比较 〔 和 可 能 的 互 换 位 置 ) 第 m 项 和 第 三 1 项 开始 。 然 后 ， 它 将 考虑 第 m-1 项 和 第 mn 一 2 项 
之 则 的 关系 ， 并 且 继续 向 列表 的 前 面 移 动 ， 育 到 列表 的 第 1 和 2 项 进行 比较 (和 可 能 的 互 换 位 置 ) 。 可 
以 有 出 ， 通 过 一 遍 排序 ， 最 小 的 表 项 将 被 移 到 表 的 最 前 面 。 因 此 ， 重 复 "_1 遍 后 就 完成 了 整个 麦 的 振 
序 。《 如 果 我 们 观察 算法 的 工作 过 程 ， 那 么 就 会 看 到 小 表 项 像 气泡 一 样 冒 到 了 列表 的 前 面 。) 使 用 我 
们 的 伪 代 码 来 表达 用 冒 泡 排序 法 实现 的 类 似 于 图 5-11 中 的 列表 排序 过 程 。 


疙 和 


朴 | 





5.5 “递归 结构 


递归 结构 提供 了 除 循环 模型 以 外 用 来 实现 重复 活动 的 另外 一 种 选择 。 循 环 所 包括 的 指令 集 
应 是 完备 的 ， 然 后 通过 某 种 重复 调用 的 方式 运行 ， 而 递归 则 是 通过 将 指令 集 作为 自身 的 一 个 子 
任务 重复 调用 来 运行 的 。 在 处 理 来 电 的 过 程 中 ， 呼 叫 等 待 的 特性 就 是 一 个 很 好 的 递归 例子 。 存 
这 个 例子 中 ， 当 处 理 另外 一 个 来 电 的 时 候 ， 先 前 未 完成 的 通话 将 被 搁 填 一边， 结果 是 一 共 进 行 
J 了 两 次 通话 。 然 而 ， 这 两 次 通话 并 不 是 以 那 种 先 执行 一 个 然后 再 执行 一 个 的 类 似 于 循环 结构 的 
方式 和 成 的 ， 而 是 一 次 通话 是 在 另外 一 次 通话 过 程 中 进行 的 。 
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作为 一 种 介绍 递归 的 方法 ， 让 我 们 再 次 处 理 在 一 个 已 经 排序 的 表 中 查找 是 否 存在 某 特定 项 
的 问题 ， 但 是 这 次 将 采用 查 字典 时 所 使 用 的 方法 来 考虑 这 个 问题 。 在 这 个 例子 中 ， 我 们 不 再 接 
疏 ” 项 一 项 或 者 是 一 页 一 页 的 顺序 进行 ， 而 是 通过 直接 翻 到 我 们 认为 目标 可 能 存在 的 那 一 页 开 
始 工作 ， 如 果 足 够 幸运 将 可 能 一 下 就 找到 目标 ， 和 否则 就 必须 继续 查找 。 但 至 少 我 们 已 经 缩小 了 
查找 的 范围 。- 

当然 , 在 查 字 典 的 时 候 , 我 人 ] 知 章 单 词 可 能 在 哪 能 查 到 的 先 验 知识 。 例如 , 查 somnambulism 
这 个 单词 ， 我 们 就 会 从 字典 的 后 面部 分 开始 查找 。 但 是 在 一 般 表 的 情况 下 ， 我 们 并 没有 这 种 先 
验 知 识 ， 亡 以 我 们 总 是 假定 从 表 的 “中 间 ” 项 开始 查询 。 这 里 “中 间 ” 这 个 词 之 所 以 被 引号 所 
后 起 来 的 是 因为 一 张 表 可 能 包含 偶数 项 ， 那 么 此 时 就 没有 准确 意义 上 的 中 间 项 了 。 在 这 种 情况 
下 ， 我 们 将 假定 该 “中 间 ” 项 指 的 是 该 列表 中 后 半 部 分 的 第 一 项 。 

如 采 表 的 中 间 项 就 是 我 们 要 找 的 项 ， 那 么 此 时 查找 成 功 。 否 则 ， 我 们 至 少 可 以 将 查找 限定 
企 表 的 前 半 部 或 者 后 半 部 , 具体 要 依赖 于 所 查找 的 目标 值 是 大 于 还 是 小 于 我 们 的 中 间 项 。( 记 住 ， 
前 提 是 我 们 所 查找 的 表 是 已 经 排 好 序 的 。》 

在 才 的 剩余 部 分 查找 ， 我 们 本 可 以 使 用 顺序 搜索 法 ， 但 这 里 仍然 使 用 在 完整 列表 中 所 使 用 
的 方法 在 表 的 剩余 部 分 进行 查找 。 也 就 是 说 ， 我 们 选 样 表 的 姨 余 部 分 的 中 间 项 作为 下 一 个 要 老 
谍 的 项 。 像 刚才 那样 ， 如 果 这 个 项 就 是 我 们 要 找 的 ， 那 么 查找 结束 ， 否 则 将 把 查找 的 范围 限定 
在 更 小 的 区 域 中 。 
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图 5-12 简要 概括 了 这 个 查找 方法 。 这 里 我 们 要 查找 的 是 图 左边 列表 中 的 John 表 项 。 我 们 “F4 
首先 考虑 中 间 项 Harry。 可 以 看 出 ,我 们 所 查找 的 目标 属于 后 半 部 分 ， 接 下 来 的 查找 将 在 原始 表 
的 后 半 部 分 开始 。 该 子 表 的 中 间 项 是 Lary， 显 然 所 查找 的 目标 在 Larry 之 前 ， 所 以 我 们 的 注意 
力 将 转 到 当前 子 表 的 前 半 部 分 。 当 我 们 查看 第 二 个 子 表 的 中 间 项 时 , 我 们 找到 了 目标 表 项 John ， 
此 时 查找 成 功 。 简 言 之 ， 我 们 的 策略 是 将 被 讨论 的 列表 连续 地 分 成 更 小 的 段 ， 直 到 最 终 找到 目 
标 或 者 发 现 查找 被 限制 在 一 个 空 段 中 。 


初始 列表 。 第 一 个 子 表 ”第 二 个 子 表 
上 [ieCe 
Bob 
疙 昌 ff 
David 
Elainme 
Fred 
人 各局 站 已 
Parry 
2 Jr 让 站 Jraene 
守 ohmn 雪 Jaopn 
本 人 elly 
和 Larry 
JWMarY 
同 癌 meyY 
已 jiVver 


图 5-12 ”使 用 我 们 的 策略 在 列表 中 查找 John 表 项 


艺术 中 的 递归 结构 
下 面 的 递归 过 程 可 用 于 在 一 块 长 方形 画布 上 生成 荷兰 画家 皮 耶 . 蒙 德 里 安 (Piet 
Mondnan ) 1872 一 1944 ) 风格 的 图 画 。 他 通过 在 一 个 长 方形 画布 上 将 长 方形 连续 划分 成 更 小 
的 长 方形 来 绘画 。 你 可 以 试图 自己 实现 下 面 的 过 程 来 画 出 与 下 面 图 案 类 似 的 图 案 ， 从 把 该 过 
程 应 用 到 你 所 工作 的 代表 画布 的 一 个 长 方形 上 开始 吧 .( 如 果 你 怀疑 由 该 过 程 表 示 的 算法 是 否 
二 一 种 符合 5.1 节 所 定义 的 算法 ， 那 么 你 的 怀疑 是 有 根据 的 。 实 际 上 ， 这 是 一 个 非 确定 性 算法 
的 例子 ， 因 为 有 很 多 地 方 需要 实现 该 过 程 的 人 或 机 器 来 作出 “创造 性 ”的 决定 。 也许 这 就 是 

为 什么 莹 德里 安 的 钻 果 被 认为 是 艺术 ， 而 我 们 的 却 不 是 . ) 


王国 呈 呈 
加 本 呈 











有 
亚 Eeeshseseeeeeeeeeeeeee 并 
aa 一 下 


procedure Mondrian(Rectangle ) 
上 f( 用 你 的 艺术 眼光 看 长 方形 太 大 ) 
then ( 把 长 方形 划分 成 2 个 较 小 的 长 方形 ; 
把 Mondrian 过 程 应 用 到 一 个 较 小 的 其 方形 
把 Mondrian 过 程 应 用 到 另 一 个 较 小 的 长 方形 } 


这 里 需要 强调 最 后 一 点 。 如 果 所 查找 的 目标 值 不 在 原始 表 中 ， 那 么 我 们 的 查找 方法 将 列表 
不 断 分 成 更 小 的 段 直 到 所 考虑 的 段 为 空 ， 此 时 算法 认为 查找 失败 。 
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图 5-13 就 是 我 们 整个 算法 的 一 个 伪 代 码 草稿 。 这 个 草稿 引导 我 们 通过 测试 表 是 否 为 空 来 开始 
得 找 过 程 。 如 果 表 为 室 ， 我 们 会 被 告知 查找 失败 。 否 则 ， 我 们 被 告知 开始 考虑 中 间 项 。 如 果 此 项 
个 是 目标 值 ， 我 们 就 被 告知 是 查找 表 的 前 半 部 分 还 是 后 半 部 分 ， 这 两 种 可 能 都 需要 第 二 次 查找 。 
显然 如 采 通 过 调用 一 个 抽象 工具 的 服务 来 执行 这 种 查找 将 十 分 方便 。 尤 其 是 ， 当 我 人 ] 应 用 一 个 称 
作 Search 的 过 程 来 执行 第 二 次 查找 时 。 因 此 ， 为 了 完成 我 们 的 程序 ， 职 必 须 提供 这 样 一 个 过 程 。 






f《 衣 为 空 ) 
then 
( 报告 查找 失败 ) 
已 |Se 
[选择 List 的 中 间 项 作为 TestEntry: 
执行 以 下 与 条 件 相符 的 case 指 令 块 
case 1: TargetValue = TestEntry 
( 报告 查找 成 功 ) 
case 2: TargetValue < TestEntry 
( 在 List 中 位 于 TestEntry 项 之 前 的 部 分 查找 TargetValue, 并 报告 查找 结果 ) 
Case 3: TargetValue > TestEntry 
( 在 List 中 位 于 TestEntry 项 之 后 的 部 分 查找 TargetValue, 并 报告 查找 结果 ) 












]end 放 






图 5-13 “二 分 搜索 技术 的 草 入 


但 是 这 个 过 程 应 该 执行 相同 的 任务 ， 而 这 个 任务 已 经 由 前 面 所 给 出 的 伪 代 码 所 表达 。 第 一 
步 ， 我 们 将 检查 给 定 表 是 否 为 室 ， 如 果 非 空 ， 它 将 开始 考虑 此 表 的 中 间 项 。 因此 我 们 可 以 提供 
和 需要 一 个 程序 仅仅 通过 识别 当前 例 程 中 名 为 Search 的 过 程 ， 并 在 二 次 查找 的 地 方 插入 对 这 个 过 


235j 程 的 另外 一 次 引用 。 结 果 如 图 5-14 所 示 。 






Frocedure Search 《List, TargetValue ) 
if ( 表 为 空 ) 
then 
( 报告 查找 失败 ) 
8jse 
[选择 List 的 中 间 项 作为 TestEntry: 
执行 以 下 与 条 件 相 符 的 case 指 令 块 
Case 1: TargetValue = TestEntry 
( 报告 查找 成 功 ) 
case <: TargetValue < TestEntry 
( 应 用 Search 过 程 查看 TargetValue 是 天 在 List 中 位 于 Te stEntry 
项 之 前 的 部 分 ， 并 报告 查找 结果 ) 
case 3: JargetValue > TestEntry 
( 应 用 Search 过 程 查看 TargetValue 是 否 在 List 中 位 于 TestEntry 
项 之 后 的 部 分 ， 并 报告 查找 结果 ) 














图 5-14 ”二 分 搜索 算法 的 伪 代 码 
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注意 ， 这 个 过 程 包含 了 一 个 对 于 自身 的 引用 。 当 然 ， 如 果 我 们 跟着 这 个 过 程 ， 然后 到 达 指 令 
庶 用 S$earch 过 程 … 


我 们 可 以 把 同样 的 过 程 应 用 到 一 个 较 小 的 表 上 , 而 该 列表 是 通过 将 Search 过 程 应 用 在 原始 列表 
上 得 到 的 。 如 果 查 找 成 功 ， 我 们 将 返回 并 声明 初始 查找 成 功 ， 如 果 第 二 次 查找 失败 ， 我 们 将 声 
明 初 始 查找 失败 。 

为 了 理解 图 $-14 中 的 过 程 是 如 何 运行 的 ,我 们 假定 一 个 表 包 括 Alice.BillCarol.David、 Evelyn、 
Fred 和 George， 碍 找 的 目标 值 是 Bil。 首 先 选择 David 〈 中 间 项 ) 作为 考虑 的 测试 项 。 因为 目标 值 

《Bil) 小 于 该 测试 项 ， 我 们 将 对 David 之 前 的 列表 项 调用 Search 过 程 〈 此 时 该 列表 是 Alice、Rill 

和 Carol)。 这 样 我 们 便 创 建 了 Search 过 程 的 第 二 个 副本 ， 并 将 它 用 于 第 二 次 查找 任务 。 

现在 我 们 拥有 两 个 正在 执行 的 查找 过 程 ， 如 图 5-15 所 示 。 先 前 的 原始 副本 在 执行 


应 用 Search 过 程 查看 TargetValue 是 否 在 List 中 位 于 TestEntry 项 之 前 的 部 分 


指令 时 将 被 暂时 挂 起 ， 此 时 我 们 将 应 用 第 二 个 副本 完成 对 列表 Alice、Bil 和 Carol 的 音 找 任 务 ， 
当 我 们 完成 第 二 次 查找 后 ,我 们 将 放弃 该 过 程 的 第 二 个 副本 ， 井 将 它 找到 的 结果 通知 原始 副本 ， 
然后 继续 原始 的 过 程 。 通 过 这 种 方式 ， 过 程 的 第 二 个 副本 被 当 作 原 始 过 程 的 子 过 程 运行 ， 完 成 
由 穆 始 的 模块 请 求 的 任务 ， 然 后 消失 。 

~ 我 们 在 这 儿 ， 


和 
一下 证 作 ja 于 ceirhy 
PET 1 二 用 本 hn 1 站 疡 Fr 让 WE ai 
本 下 可 
5 人 Se 语 直 | 和 
Ed LE 人 各 下 ERE Le ae 吕 cn hr 
WGHIRi 本 让 的 -HIP 本 PPOdrai 二 二 有 1 六 本 本 计 hi 和 he 3 站 Eeeniiiaim 二 5 
LE BTUHUT 
ar ul 相交 人 有 本， 仆 二 sf h FIc 
二 ER 
ED 时 本 ET 有 9 证 用 个 天 疝 ma 1 下 人 HT 条 现下 全 2 证 二 再 和 和 1 让 二 哆 本 PUT 
IE ER 对 LU Pricedirtg TENHHETF=w， 证 .后 昌 下 
5 Poem ihe 西 让 h amd PPFEeT TH 
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List List 
， 总 外 ic 和 
-一 一 一 一 一 一 一生 且 训 
| 亡 刍 FrD| 
Dawidd [TestEntry} 
EVweIVn 
FFed 
全 BOrOe 


第 二 次 查找 中 ，B 记 被 选 作 测试 项 ， 这 是 因为 它 是 表 Alice、Bil 和 Carol 的 中 间 项 。 由 于 
这 一 项 与 所 查找 的 目标 相同 ， 于 是 此 过 程 就 宣告 整个 查找 成 功 并 结束 。 

企 这 一 点 上 ， 我 们 已 经 把 过 程 原始 副本 所 请 求 的 第 二 次 查找 完成 ， 所 以 可 以 继续 原始 副本 
的 执行 。 此 时 我 们 又 被 告知 需要 把 第 二 次 查找 的 结果 通知 原始 查找 。 因 此 ， 最 终 得 到 结论 ， 原 
始 查 找 成 功 。 我们 的 查找 过 程 正确 结束 ， 结 果 表 明 Bill 是 表 Alice、Bob、Carol. David、Evelyn、 
Fred 和 George 中 的 成 员 。 

现在 让 我 们 考虑 ， 如 果 要 求 图 5-14 所 示 的 过 程 在 表 Alice、Carol、 Evelyn、EFred 和 George 


中 音 找 David， 将 会 发 生 什 么 情况 呢 ? 这 次 过 程 的 原始 副本 选择 Evelyn 为 测试 项 ， 并 推断 目标 “|237 
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肯定 存在 于 表 的 前 半 部 分 。 因 此 它 请 求 过 程 的 另外 一 个 副本 对 Evelyn 之 前 的 表 进 行 查找 一 一 也 
惑 是 包含 Alice 和 Carol 两 项 的 表 。 在 此 阶段 ， 我 们 遇 到 了 图 5-16 所 示 的 情况 。 


我 们 在 这 册 





图 5-16 


过 程 的 第 二 个 副本 选择 Carol 当 作 当前 项 ， 同时 推断 目标 必定 存在 于 该 表 的 后 半 部 分 。 然 
后 ， 饭 将 请 求 过 程 的 第 三 个 副本 来 寻找 Alice 和 Carol 组 成 的 表 中 Carol 后 面 的 名 字 组 成 的 表 。 
该 子 表 是 空 表 ， 所 以 过 程 的 第 三 个 副本 需要 在 一 个 空 表 中 寻找 目标 项 。 5-17 显示 了 目前 所 处 
的 情况 。 过 程 的 原始 副本 处 理 表 Alice、Carol、Evelyn、Fred 和 George 的 查找 任务 ， 测 试 项 是 
Evelyn; 第 二 个 副本 处 理 表 Alice 和 Carol 的 查找 ， 测 试 项 是 Carol， 第 三 个 副本 将 要 在 一 个 空 
表 中 开始 查找 。 我 们 在 这 几 





图 5-17 
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当然 ， 过 程 的 第 三 个 副本 很 快 就 会 推断 它 的 搜索 已 经 失败 并 终止 运行 。 第 三 个 副本 的 任务 
的 完成 使 得 第 二 个 副本 能 够 继续 执行 。 第 二 个 副本 发 现 它 请 求 的 查找 失败 ， 于 是 它 宣 布 它 的 查 
找 失 败 ， 并 且 终 止 。 过 程 的 原始 副本 得 到 这 个 消息 后 推断 它 的 过 程 失败 同时 终止 。 我 们 的 例 程 
正确 地 推断 David 不 在 Alice、Carol、BEvelyn、Fred 和 George 组 成 的 表 中 。 

综 上 所 述 ， 如 果 我 们 回顾 前 面 的 例子 ， 我 们 能 够 看 到 图 5-14 所 示 的 算法 重复 地 将 所 考虑 的 
列表 分 成 两 个 较 小 的 块 ， 并 将 后 续 的 查找 严格 限制 在 其 中 一 个 块 中 。 这 种 一 分 为 二 的 方法 就 是 
该 算法 为 什么 称 为 二 分 搜索 〈binary search) 的 原因 。 


5.5.2 ”网 归 控制 


二 分 搜索 算法 与 顺序 搜索 两 者 相似 之 处 在 于 都 需要 执行 一 个 重复 过 程 。 但 是 ， 这 种 重复 的 
实现 却 是 截然 不 同 的 。 顺 序 搜索 是 以 一 种 循环 的 方式 重复 执行 一 个 过 程 ， 而 二 分 搜索 则 是 把 每 
一 阶段 重复 当 作 前 一 阶段 的 子 任 务 ， 该 技术 被 称 作 递归 〈recursion )。 

正如 我 们 所 见 的 ， 竟 归 过 程 的 执行 之 所 以 使 人 容易 困惑 在 于 它 对 于 自身 的 多 重 调用 ， 每 一 
次 调用 都 称 为 一 次 过 程 的 激活 。 这 些 激活 通过 一 种 嵌 套 方式 动态 创建 ， 并 随 着 算法 的 前 进而 最 
终 消失 。 在 任何 给 定 的 时 间 中 所 有 存在 的 激活 ， 只 有 一 个 是 正在 执行 的 ， 其 他 的 都 处 于 等 待 状 
态 ， 等 待 另 外 的 活动 终止 后 方 可 继续 。 

作为 一 个 重复 的 过 程 ， 递 归 系 统 也 依赖 于 与 循环 结构 相似 的 正确 控制 方式 。 就 像 循 环 控制 
一 样 ， 递 归 系 统 也 依赖 于 对 终止 条 件 的 测试 ， 同 时 也 必须 保证 终止 条 件 能 够 到 达 。 事 实 上 ， 正 
确 的 递归 控制 应 该 包含 与 循环 控制 中 相同 的 三 个 组 成 部 分 一 一 初始 化 、 修 改 和 终止 测试 。 

通 铅 ， 遍 归程 序 将 终止 条 件 《通常 称 作 基 本 条 件 〈base case) 或 者 退化 条 件 〈degenerative 
case)) 设计 在 请 求 继续 活动 之 前 ， 如 果 不 满足 终止 条 件 ， 例 程序 就 创建 自己 的 另外 一 个 激活 状 
态 并 且 分 配 这 个 状态 解决 一 个 臣 离 终止 条 件 更 近 的 修订 问题 的 任务 。 但 是 ,如 果 满 足 终止 条 件 ， 
现 有 的 状态 就 会 终止 ， 并 不 再 创建 任何 其 他 激活 状态 了 。 

让 我 们 来 看 看 图 5-14 中 的 二 分 搜索 过 程 是 如 何 实现 重复 控制 的 初始 化 和 修改 阶段 的 。 在 这 
个 例子 中 ， 一 旦 目标 值 被 找到 或 者 任务 被 缩减 到 只 是 完成 对 空 表 的 查找 ， 额 外 活动 的 创建 就 会 


停止 。 整 个 过 程 是 从 简单 地 给 出 初始 泰和 目标 值 开 始 的 。 从 该 初始 配置 开始 ， 过 程 就 会 将 其 所 . 


分 配 的 任务 修改 为 在 更 小 的 表 中 进行 查找 。 因 为 原始 表 的 长 度 有 限 ， 并 且 每 次 修改 步骤 都 会 减 
少 所 考虑 的 表 长 度 ， 所 以 我 们 可 以 确保 目标 值 最 终 会 被 找到 或 者 任务 最 终 会 被 缩减 到 只 对 空 表 
进行 查找 。 因 此 ， 我 们 能 够 推 斯 这 个 重复 过 程 一 定 可 以 结束 。 

最 后 ， 由 于 循环 和 递归 控制 结构 都 是 用 来 完成 一 系列 指令 重复 运行 的 方法 ， 我 们 可 能 会 问 
这 两 种 结构 是 否 在 能 力 上 等 价 。 换 名 话说 ， 如 果 一 个 算法 被 设计 成 循环 结构 ， 那 么 是 否 存在 一 
个 递归 结构 算法 ， 这 个 算法 也 可 以 完成 前 面 那个 循环 结构 算法 所 要 解决 的 问题 或 反之 ? 这 样 的 
问题 在 计算 机 科学 中 是 非常 重要 的 , 因为 其 答案 告诉 我 们 什么 特性 应 该 被 提供 给 程序 设计 语言 
以 便 获得 可 能 的 最 强大 的 程序 设计 系统 。 我 们 会 在 第 12 章 中 回 到 这 个 问题 ， 那 里 我 们 将 考虑 更 
多 计算 机 科学 理论 方面 的 问题 以 及 它 的 数学 基础 。 带 着 这 个 背景 ， 我 们 可 以 证 明 附录 E 中 提 到 
的 “ 迁 代 和 递归 结构 的 等 价 性 ” 


问题 与 练习 

1. 在 名 单 Alice、Brenda、Carol、Duane、Evelyn、Fred、George、Henry 、Irene、Joe 、Kafl- Earry Wary 、 
Nancy 和 Oliver 中 按照 二 分 搜索 图 $-14) 查找 Joe 的 时 候 ， 在 查找 过 程 中 会 遇 到 哪些 名字 

2. 使 用 二 分 搜索 在 200 项 中 进行 查找 的 时 候 所 需 查找 的 最 大 项 数 是 多 少 ? 如 果 是 100 000 又 会 如 何 呢 ? 
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3. 如 玉 N 的 初始 值 为 1， 那 么 以 下 前 归 过 程 会 打印 出 什么 样 的 数列 ? 
Procedure ExercisetI) 
打印 N 的 值 ， 

IN<3) then (对 N+1 应 用 Exercise 过 程 )， 
打印 N 的 值 ; 


4. 问题 与 练习 3 中 的 递归 过 程 的 终止 条 件 是 什么 ? 


5.6” 有 效 性 和 正确 性 ” 


在 本 节 中 ， 我 们 介绍 两 个 构成 计算 机 科学 重要 的 研究 镇 域 的 主题 。 第 一 个 是 算法 有 效 性 ， 
第 二 个 是 算法 正确 性 。 


5.6.1 算法 有 效 性 


仿生 当今 的 计算 机 每 秒 可 以 处 理 数 百 万 条 指令 ， 有 效 性 仍旧 是 算法 设计 中 所 关注 的 一 个 主要 
门 题 。 通 党 ， 在 效率 高 低 的 两 个 算法 之 间 的 选择 能 够 产生 对 于 问题 的 实用 或 者 不 实用 的 两 种 解 . 

让 我 们 考虑 这 样 一 个 问题 : 一 个 大 学 的 教务 主任 需要 面 对 检 索 和 更 新 学 生 记录 的 任务 。 尽 
管 在 任何 一 个 学 期 学 校 可 能 只 有 大 约 一 万 名 学 生 在 册 ， 但 是 它 的 “当前 学 生 ” 文件 包 括 了 超过 
一 旋 条 的 学 生 记 录 ， 这 些 学 生 由 于 他 们 在 过 去 的 几 年 中 至 少 注册 了 -一 次 但 并 没有 完成 学 业 ， 所 
少 在 某 种 意义 上 被 认为 是 现在 的 学 生 。 眼 下 ， 让 我 们 假设 这 些 学 生 的 记录 以 表 的 形式 存储 于 教 
务 主任 的 计算 机 中 ， 这 些 表 依照 学 号 顺序 排列 。 为 了 寻找 任何 一 条 学 生 记 录 ， 教 务 主任 要 左 这 
张 表 中 查找 特定 的 学 号 。 

拆 们 已 经 讲述 了 两 种 可 用 于 在 这 些 已 排序 的 表 中 进行 查找 的 算法 ， 顺 序 搜索 法 和 二 分 搜索 
法 。 现 在 的 问题 是 ， 对 于 教务 主任 ， 在 这 两 种 算法 中 进行 选择 是 否 会 带 来 不 同 的 效果 。 我 们 首 
先 考 虑 顺序 搜索 法 。 

舍 定 一 个 学 生 的 学 号 ， 顺 序 搜索 算法 从 表 的 开头 开始 ， 将 所 有 的 记录 与 期 望 学 号 相 比 较 . 
四 为 不 知道 关于 目标 值 的 任何 原始 信息 ， 我 们 不 能 推断 究竟 要 查找 多 少 条 记录 才能 得 到 结果 。 
我 们 可 以 假定 ， 在 多 次 查找 之 后 ， 我 们 认为 平均 查找 深度 是 表 的 一 半 长 度 ， 有 的 可 能 短 一些 ， 
有 的 可 能 长 一 些 。 因 此 经 过 一 段 时 间 我 们 可 以 估计 ， 顺 序 搜索 平均 每 次 大 概 需要 寻找 15 000 条 
记录 。 如 果 检 索 并 且 检 查 每 一 条 记录 需要 10 ms， 那么 这 样 的 查找 平均 需要 150 s 一 一 这 个 时 间 
对 于 演 竺 获得 学 生 记录 的 教务 主任 来 说 是 不 可 忍受 的 。 即 使 检索 和 检查 每 条 记录 只 需要 me 
那么 整个 查找 仍然 需要 大 概 15 s， 这 个 等 待 时 间 仍然 相当 长 。 

和 区 ， 一 分 搜索 算法 通过 比较 目标 值 和 表 的 中 间 项 来 进行 查找 。 如 果 不 是 期 望 的 记录 ， 则 至 
少将 查找 限制 在 原始 表 的 一 半 。 因 此 ， 在 查询 一 个 有 30 000 条 记录 的 表 的 中 间 项 之 后 ， 一 分 搜 过 
需要 再 次 考虑 的 记录 数量 最 多 15 000 条 。 在 第 二 次 搜索 之 后 ， 地 多 还 剩余 7500 条 ， 然 后 在 第 三 
次 后 ， 又 会 有 3750 条 记录 被 省 去 ， 照 此 继续 ， 我 们 发 现 最 多 15 次 之 后 ， 目 标 值 就 应 该 在 这 个 有 
30 000 条 记 隶 的 表 中 被 找到 。 因 此 ， 如 果 每 一 次 检索 记录 需要 10 ms， 那 么 查找 一 个 特定 记录 的 
过 程 就 只 需要 0.15 s 一 一 这 意味 着 ， 对 于 教务 主任 来 说 ， 访问 任何 特定 记录 可 以 瞬间 完成 。 我 们 
得 出 结论 ;在 顺序 搜索 算法 和 二 分 搜索 算法 之 间 的 选择 将 对 该 应 用 产生 了 巨大 影响 

们 个 例 了 表现 了 计算 机 科学 领域 中 对 大 家 熟知 的 算法 分 析 的 重要 性 ， 这 种 分 析 包 含 了 对 于 
笃 源 的 研究 ， 比 如 算法 需要 消耗 的 时 间或 者 存储 空间 资源 。 这 种 研究 的 一 个 主要 应 用 在 于 给 出 
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了 对 于 二 选 一 算法 之 间 不 同 优点 的 评估 。 

算法 分 析 通 常 包 括 最 优 情况 分 析 、 最 差 情 况 分 析 和 平均 情况 分 析 。 在 我 们 的 例子 中 ， 我 们 
通过 分 析 平 均 情况 性 能 下 的 顺序 搜索 法 和 最 差 情况 性 能 下 的 二 分 搜索 算法 在 30 000 条 记录 中 完 
成 查找 押 需 的 时 间 。 通 常 这 种 分 析 应 该 在 更 为 普通 的 情况 下 进行 。 也 就 是 说 ， 当 考虑 查找 算法 
的 时 候 ， 我 们 不 能 关注 于 表 的 特定 长 度 ， 而 是 要 尝试 列 出 某 种 可 以 表示 任何 长 度 的 表 中 进行 查 
找 的 鼻 法 的 性 能 公式 。 不 难得 出 对 于 任意 长 度 的 表 均 有 意义 的 公式 。 具 体 而 言 ， 当 需要 在 长 度 
为 m 的 表 中 应 用 时 ， 顺 序 搜索 算法 的 平均 查找 长 度 是 w2， 然 而 二 分 搜索 算法 在 最 差 情况 下 的 查 
找 长 度 不 超过 1gnm。(1gm 表 示 以 2 为 底 z 的 对 数 ) 

我 们 现在 来 用 类 似 的 办 法 分 析 揪 入 排序 算法 〈 如 图 5$-11 所 示 )。 回想 这 个 算法 涉及 选择 表 
项 ， 该 项 称 为 主 元 项 ， 将 此 项 与 其 之 前 的 那些 项 比较 直到 找到 正确 的 插入 位 置 ， 然 后 将 主 元 项 
插入 这 个 位 置 。 因 为 该 算法 主要 受 两 个 名 字 之 间 的 比较 的 控制 ， 我 们 的 方法 将 计 当 表 的 长 度 为 
严 的 时 候 这 种 比较 的 次 数 。 

算法 从 把 表 的 第 2 项 当 作 主 元 开始 。 然 后 ， 算 法 继续 选择 后 面 的 表 项 作为 主 元 直到 表 的 未 
尾 。 在 最 佳 情况 下 ， 每 一 个 主 元 都 已 经 在 合适 的 位 置 ， 因 此 它 只 需要 与 一 项 进行 比较 。 因 此 ， 
最 佳 情 况 下 ， 应 用 插入 排序 到 一 个 有 项 的 表 排 序 需要 进行 呈 ] 次 比较 〈 第 2 项 与 一 项 比较 ， 
第 3 项 与 一 项 比较 ， 依 次 类 推 )。 

相反 ， 在 最 差 情况 下 ， 每 一 个 主 元 都 必须 与 表 中 排 在 它 前 向 的 所 有 记录 进行 比较 之 后 才 找 
到 合适 的 位 置 。 这 种 情况 发 生 在 表 被 反 向 排序 的 时 候 。 在 这 种 情况 下 ， 第 1 个 主 元 〈 表 的 第 二 
条 记录 ) 要 与 一 项 进行 比较 ， 第 2 个 主 元 ( 表 的 第 三 条 记录 ) 要 与 两 项 进行 比较 ,依次 类 推 (如 
图 5-18 所 示 )。 因 此 ， 在 给 长 度 为 二 的 表 排序 时 总 共 需 要 进行 的 比较 次 数 为 142+3+…+(r_1)， 


也 就 是 >(nz -中 。 具 体 而 言 ， 如 果 一 个 表 包 含 10 项 ， 在 最 差 情况 下 ， 插 入 排序 法 需要 进行 43 
次 比较 。 
对 每 个 主 元 所 做 的 比较 


原始 列表 。 第 1 个 主 元 ”第 2 个 主 元 。 第 3 个 主 元 ”第 4 个 主 元 已 排序 的 表 
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图 $-18 将 插 信 排序 应 用 于 最 差 情况 中 
在 插入 排序 平均 情况 中 ， 我 们 期 望 每 一 个 主 元 与 表 中 在 它 前 面 项 的 一 半 进 行 比较 。 这 样 一 来 ， 
一 共 需 要 执行 的 次 数 是 最 坏 情况 的 一 半 ， 也 就 是 一 (nz 一 丰 次 比较 可 以 完成 对 n 项 的 排序 。 例 如 


假使 我 们 用 插入 排序 算法 为 长 度 为 10 的 多 个 表 排 序 ， 平 均 情况 下 每 次 排序 需要 22.5 次 比较 。 

这 个 结果 的 重要 性 在 于 插入 排序 法 执行 中 的 比较 次 数 给 出 了 执行 这 种 算法 对 时 间 的 大 概 
需求 量 。 使 用 这 个 估算 ， 图 5-19 显示 了 一 个 当 列 表 的 长 度 增加 时 ， 执 行 插入 排序 算法 需要 多 
少时 间 的 图 。 该 图 是 基于 我 们 对 于 算法 最 坏 情 况 的 分 析 。 在 此 分 析 中 ， 我 们 能 够 推算 出 在 长 


度 为 ”的 列表 中 进行 排序 最 多 需要 二 (2 -由 次 比较 。 在 图 中 ， 我 们 标 出 了 几 个 表 的 长 度 ， 同 
时 给 出 了 在 每 一 个 情况 下 需要 的 时 间 。 注 意 ， 当 列表 的 长 度 等 步 长 增加 时 《〈 即 每 次 增加 的 长 
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度 相同 )， 排 序 需 要 的 时 间 的 增长 速度 更 快 。 因 此 这 个 算法 在 列表 的 长 度 增加 的 时 候 ， 效率 会 


变 得 越 来 越 差 。 


执行 算法 所 需要 的 时 间 


增加 列表 长 雇 昌 | SI 
时 时 间 的 增长 








一 一 一 列表 的 长 度 
长 记 均 匀 增 长 


镜 5-19 插入 排序 算法 的 最 差 情 况 分 析 图 
让 我 们 使 用 相似 的 方法 来 分 析 一 下 二 分 搜索 算法 。 回想 前 面 我 们 推导 得 到 使 用 该 算法 在 长 度 
为 mn 的 列表 中 进行 查找 的 时 候 需要 最 多 查询 lgm 项 ， 这 种 查询 表示 了 对 不 同 长 度 的 列表 执行 这 一 算 
法 所 需要 时 间 的 大 概 估算 。 图 5-20 给 出 了 基于 这 种 分 析 的 一 张 曲线 图 ， 我 们 依旧 标 出 几 条 等 步 长 


增加 的 列表 的 长 度 和 每 种 情况 下 算法 执行 所 需要 的 时 间 量 。 注 意 ， 算法 随 着 列表 的 长 度 的 增加 ， 
对 于 时 间 需 求 的 增加 是 在 逐步 递减 的 。 也 就 是 说 ， 二 分 搜索 法 在 较 长 的 列表 中 效率 更 高 。 


执行 算法 所 需要 的 时 间 


增加 列表 长 度 
时 时 间 的 增长 





列表 长 度 
长 度 均匀 增长 


铬 5-20 ”二 分 搜索 法 的 最 差 情 况 分 析 图 


图 5-19 和 图 5-20 的 区 别 在 于 图 像 所 包括 的 大 体形 状 ， 该 大 体形 状 揭示 了 一 个 算法 在 越 来 越 大 
的 输入 规模 的 情况 下 到 底 有 多 好 。 而 且 一 个 图 像 的 大 体形 状 是 由 表达 式 的 类 型 而 非 具 体 的 表达 式 所 
确定 的 一 一 所 有 的 线性 表达 式 的 图 像 都 是 一 条 直线 ， 而 二 次 表达 式 则 给 出 一 条 二 次 曲线 ， 所 有 的 对 
数 表 达 式 都 可 以 得 到 图 5-20 中 的 对 数 曲线 。 习 避 上 我 们 用 一 个 可 以 产生 一 个 形状 的 最 简单 表达 式 
来 标识 该 形状 ， 具 体 而 言 ， 我 们 用 表达 式 吧 来 识别 二 次 曲线 ， 而 用 lgn 来 表示 对 数 曲 线 。 
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我 们 已 经 看 到 了 通过 比较 执行 一 个 算法 需要 的 时 间 来 反映 该 算法 的 效率 特性 的 图 的 形状 ， 因 
此 可 以 根据 这 些 图 的 形状 来 对 算法 进行 分 类 一 一 通常 是 基于 算法 的 最 差 情 况 分 析 。 用 来 区 分 这 些 
类 型 的 符号 有 时 被 称 作 大 @ 标 记 。 所 有 图 为 二 次 曲线 的 算法 ， 例 如 插入 排序 法 ， 都 被 划 归 为 BCr) 
表示 的 算法 类 型 ， 所 有 图 像 为 对 数 曲线 的 算法 ， 比 如 二 分 搜索 法 ， 都 被 分 到 @Ugm) 表 示 的 算法 类 
型 中 。 知 道 特 定 算法 属于 的 类 型 使 我 们 可 以 预测 它 的 性 能 ， 并 且 可 以 拿 它 与 能 够 完成 相同 工作 的 
算法 进行 比较 。 两 个 B(o) 算 法 在 输入 大 小 增加 的 时 候 ， 对 于 时 间 将 会 有 相近 的 需求 变化 ， 然 而 一 
个 9dgm) 算 法 就 不 会 像 9(z) 算 法 那样 随 着 输入 大 小 的 增加 对 时 间 的 需求 扩张 得 如 此 剧烈 。 


5.6.2 ”软件 验证 


回想 波 利 亚 对 于 问题 求解 的 分 析 〈5.3 节 ) 中 的 第 4 阶段 就 是 对 问题 解决 方案 的 准确 性 和 其 
作为 求解 其 他 问题 的 工具 的 潜力 进行 评价 。 这 个 阶段 第 一 部 分 的 重要 性 由 下 面 的 例子 体现 出 来 : 


一 个 拿 着 由 7 个 金 环 组 成 的 链子 的 旗 行 者 必须 在 一 个 饭店 里 住 7 夜 。 每 一 夜 的 租 
金 是 金 链 中 的 一 环 。 应 该 怎样 对 链子 进行 最 少 次 数 的 切割 ， 旅 行者 才能 每 天 早上 支付 
旅店 的 一 环 而 不 用 提前 支付 住宿 费 ? 


首先 我 们 认识 到 并 不 是 每 一 环 都 必须 被 切 开 。 如 果 我 们 只 切 开 第 二 个 环 ， 那 么 我 们 就 可 以 
让 第 一 个 环 和 第 二 个 环 与 另外 5 个 环 分 开 。 按 照 这 个 想法 ， 我 们 得 到 这 样 一 种 解 ， 就 是 只 需要 
切割 链 中 的 第 二 、 第 四 和 第 六 个 环 ， 这 个 过 程 将 所 有 的 环 分 开 而 只 对 三 个 环 进行 了 切割 《如 图 
5-21 所 示 )。 此 外 ， 任 何 更 少 次 数 的 切割 都 会 留 下 两 个 仍然 连 在 一 起 的 环 ， 所 以 我 们 推断 这 个 问 
题 的 正确 答案 应 该 是 3 次 。 

进一步 考虑 这 个 问题 ， 我 们 观察 到 在 只 有 第 三 个 环 被 切 开 的 时 候 , 我 们 获得 了 3 部 分 金 链 ， 
长 度 分 别 是 1、2 和 4《 如 图 5-22 所 示 )。 对 这 些 氛 ， 我 们 可 以 进行 如下 操作 : 

第 一 天 早上 : 给 饭店 一 个 环 。 

第 二 天 早上 : 给 饭店 一 个 两 个 环 的 金 链 ， 同 时 找 回 一 个 环 。 

第 三 天 早上 :给 饭店 一 个 环 。 

第 四 天 早上 : 把 四 个 环 的 金 链 给 饭店 ， 同 时 找 回 原先 给 饭店 的 那 三 个 环 。 

第 五 天 早上 : 给 饭店 一 个 环 。 

第 六 天 早上 : 给 饭店 一 个 两 个 环 的 金 链 ， 同 时 找 回 一 个 环 。 
结果 ， 我 们 的 第 一 个 答案 ， 也 就 是 那个 我 们 确定 是 正确 的 方法 ， 实 际 上 是 错误 的 。 但 是 ， 我 们 又 如 
何 认 定 我 们 的 新 方法 是 正确 的 呢 ? 我 们 可 能 这 样 反 驱 : 因为 一 个 环 必 须 在 第 一 天 早上 给 饭店 ， 所 以 
至 少 要 从 金 链 上 切 一 个 环 下 来 ， 同 时 因为 我 们 的 新 办 法 只 需要 一 次 切割 ， 押 以 必定 是 最 优 的 。 





提 于 
CORE CR 
F 1 琶 Rn 天 辣 Rn 3 7 全 2 二 
人 @ 人 ee@KG) GO 
图 5-21 ”用 3 次 切割 将 链子 分 开 图 5-22 只 用 1 步 将 链子 分 开 


转换 到 程序 设计 环境 中 ， 这 个 例子 强调 了 一 个 被 认为 正确 的 程序 和 一 个 正确 的 程序 之 间 的 
区 别 ， 二 者 并 不 相同 。 数 据 处 理 领 域 充 满 了 可 怕 的 事情 ， 比 如 尽管 “知道 ”一 个 软件 是 正确 的 


kk 
6 
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但 最 终 还 是 因为 一 些 疫 有 预料 到 的 情况 而 在 关键 的 时 刻 发 生 错 误 。 因 此 软件 验证 是 一 种 重要 承 
谢 ， 并 且 发 现 有 效 的 验证 技术 也 成 为 了 计算 机 科学 中 一 个 活跃 的 研究 领域 。 

企 这 个 领域 内 ， 研 究 的 一 条 主线 尝试 把 形式 逻辑 技术 用 于 证 明 一 个 程序 的 正确 性 。 也 就 是 
说 ， 目 标 是 用 形式 逻辑 来 证 明 程 序 表达 的 算法 确实 做 了 它 试图 做 的 工作 。 基 本 的 课题 是 通过 将 
验证 过 程 化 为 一 个 正规 过 程 ， 防 止 那 些 可 能 与 直觉 有 关 的 不 准确 的 推断 ， 就 像 金 链 问题 一 样 。 
让 我 们 更 详细 地 考虑 把 这 个 方法 应 用 于 程序 验证 中 。 


软件 验证 之 外 
文中 所 讨论 的 验证 问题 并 不 是 软件 独 有 的 。 确 认 硬 件 执行 程序 没有 错误 也 是 一 个 同等 重 
要 的 问题 ， 这 涉及 电路 设计 和 机 器 构造 的 验证 。 而 有 全 ， 质 量 的 优 劣 非常 依赖 于 测试 ， 就 像 在 
软件 中 所 做 的 那样 ， 这 意味 着 任何 一 个 细微 的 错误 都 可 能 出 现在 最 终 的 产品 中 。 一 个 例子 是 
20 世 纪 40 年 代 由 哈佛 大 学 建造 的 马克 一 号 计算 机 ， 它 包 爹 了 很 多 布线 错误 ， 而 这 些 错 误 很 多 
年 那 没有 被 发 现 。 一 个 更 近 的 例子 是 在 早期 奔腾 微 处 理 器 中 浮 点 部 分 出 现 的 错误 。 在 这 两 个 
例子 中， 错误 都 是 在 产生 严重 后 果 之 前 被 发 现 的 。 


就 好 像 正 规 数学 证 明基 于 会 理 〈 几 何 证 明 通 常 基于 欧 几 里 得 定理 ， 然 而 其 他 证 明 可 能 基于 
集合 论 的 公理 )， 一 个 程序 正确 性 的 正规 证 明 是 基于 设计 程序 所 使 用 的 规格 说 明 。 为 了 证 明 一 个 
程序 正确 地 为 一 个 姓名 列表 进行 了 排序 ， 不 芒 假设 程序 的 输入 是 一 个 姓名 列表 ， 或 者 ， 如 果 一 
个 程序 是 设计 用 来 计算 一 个 或 者 更 多 正 数 的 平均 值 , 则 假设 实际 上 输入 由 一 个 或 多 个 正 数组 成 。 
简 言 之 ， 正 确 性 证 明 是 从 对 于 确定 条 件 的 假设 开始 的 ， 这 个 条 件 称 作 前 提 条 件 〈(precondition )， 
以 此 来 满足 程序 执行 开始 的 需要 。 

正确 性 证 明 的 下 一 步 是 考虑 这 些 预 设 条 件 的 结果 是 如 何在 程序 中 传播 的 。 为 了 这 个 目的 ， 
研究 人 员 分 析 了 各 种 各 样 的 程序 结构 来 确定 一 个 语句 〈 一 个 在 结构 被 执行 前 被 认为 是 正确 的 
语句 ) 是 如 何 受 到 结构 执行 的 影响 的 。 作 为 一 个 简单 的 例子 ， 如 果 在 指令 X--Y 之前， 一 个 关 
于 Y 值 的 确定 语句 就 已 经 得 到 ， 那 么 同样 的 关于 X 的 语句 就 可 以 在 指令 执行 以 后 获得 确认 。 
更 准确 地 讲 ， 如 果 在 指令 执行 之 前 已 知 Y 的 值 不 为 0， 那么 指令 执行 以 后 ， 也 可 以 推断 X 也 
一 定 不 为 0。 

一 个 稍微 复杂 的 例子 发 生 在 下 面 这 样 的 if-then-else 结构 中 ， 


f (条 件 ) then (指令 从 
else (指令 昌 ) 


此 处 ， 如 果 某 些 已 知 的 语句 在 结构 执行 以 前 已 经 获得 ， 那 么 在 执行 指令 A 之 前 ， 我 们 立即 知道 
那个 语句 以 及 测试 条 件 篆 为 真 ， 相 反 如 果 指 令 B 将 被 执行 ,我 们 知道 语句 和 测试 条 件 一 定 为 假 。 

依照 这 些 规则 ， 通 过 识别 语句 ， 也 就 是 断言 〈assertion)， 来 进行 正确 性 证 明 ， 断 言 能 够 在 
程序 的 不 同 点 建立 。 所 得 到 的 结果 是 一 个 断言 集合 ， 每 一 项 都 是 程序 预 设 条 件 的 一 个 结果 以 及 
可 以 得 到 在 程 床 中 建立 断言 这 一 点 的 一 组 指令 。 如 果 在 程序 结尾 建立 的 断言 可 以 得 到 相应 的 输 
出 《 称 为 后 继 条 件 〈postcondition))， 我 们 就 能 够 断定 程序 是 正确 的 。 

作为 一 个 例子 ， 考 虑 图 $-23 中 所 示 的 一 个 典型 的 while 循环 结构 。 假 设 ， 作 为 在 A 点 的 已 
知 前 提 条 件 的 一 个 结果 ,我 们 能 够 建立 这 样 一 个 断言 ， 循 环 过 程 中 每 次 终止 条 件 测试 的 时 候 〈B 
所 )， 断 言 为 真 。( 这 样 一 个 循环 内 部 的 断言 称 作 循环 不 变 式 〈loop invariant)。) 然后 ， 如 果 循 环 
一 旦 终止 ，C 点 就 会 开始 执行 。 此 处 我 们 可 以 推断 循环 不 变 式 和 终止 条 件 此 时 均 成 立 。( 循 环 不 
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变 式 仍旧 成 立 ， 是 因为 终止 测试 不 改变 程序 中 的 任何 值 ， 终 止 条 件 成 立 是 因为 循环 到 此 已 经 结 
束 .。) 如 果 这 此 组 合 语句 暗示 着 期 望 的 后 继 条 件 ， 我 们 的 正确 性 证 明 仅仅 通过 初始 化 和 修改 最 终 
导致 终止 条 件 的 循环 组 件 就 可 以 完成 。 


[man 


官 冶 化 


钼 环 不 变 式 斑 


图 5-23 ”与 典型 while 结 构 相 关联 的 断言 


应 该 拿 这 个 分 析 与 图 5-11 中 关于 插入 排序 的 例子 相 比较 。 那 个 程序 的 外 层 循环 是 基于 下 面 
的 循环 不 变 式 的 : 


每 次 终止 条 件 测 试 执行 的 时 候 ， 从 位 置 1 到 位 置 N-1I 之 间 的 项 已 经 完成 了 排序 
并 且 终 止 条 件 是 
太 的 值 大 于 列表 的 长 度 。 


因此 ， 如 果 循 环 终止 ， 我 们 知道 两 个 条 件 均 已 满足 ， 这 些 条 件 瞳 示 整 个 列表 已 经 排序 。 

程序 验证 技术 发 展 的 进度 依然 非常 具有 挑战 性 。 即 便 这 样 ， 还 是 取得 了 一 些 进展 ， 其 中 一 
个 更 具 重 要 性 的 进展 是 在 编程 语言 SPARK 中 发 现 的 ，SPARK 语 言 与 更 为 流行 的 Ada 语 言 之 间 有 
着 紧密 的 联系 。( 关 于 Ada 语 言 ， 我 们 将 在 下 一 章 举 例 说 明 。) 除了 人 允许 程序 用 像 伪 代码 这 样 的 
高 层 形 式 表示 之 外 ，SPARK 还 提供 给 程序 员 包 含 判断 的 方法 〈 如 程序 里 的 前 提 条 件 、 后 继 条 件 
和 御 环 不 变量 )。 这 样 ， 用 SPARK 语 言 编 号 的 程序 不 仅仅 包含 了 应 用 的 算法 ， 还 包含 了 形式 化 
方法 和 正确 性 证 明 技 术 应 用 所 需 的 信息 。 迄 今 为 止 ，SPARK 已 经 成 功 地 应 用 于 涉及 关键 软件 应 
用 的 很 多 软件 开发 项 目 中 ， 包 括 美国 国家 安全 局 的 安全 软件 、 美 国 洛克 希 德 马丁 公司 的 C130J 
大 力 神 运输 机 的 内 部 控制 软件 以 及 关键 铁路 运输 控制 系统 。 

从 官 SPARK 成 功 了 ， 但 形式 化 程序 验证 技术 并 没有 得 到 广泛 的 应 用 , 今天 大 多 数 的 软件 通过 测 
试 流程 来 进行 “验证 ”， 这 个 流程 也 还 是 不 可 靠 的。 毕竟 通过 测试 进行 的 验证 仅 能 说 明 程序 在 测试 
的 案例 下 是 正确 的 ， 而 且 任何 附加 的 结论 也 仅仅 是 预测 ， 程 序 中 所 包含 的 错误 往往 都 是 测试 过 程 中 
和 程序 运行 中 一 些 没 有 注意 到 的 细微 地 方 的 结果 。 因 此 就 像 我 们 在 黄金 链 中 的 问题 一 样 ， 即 使 做 了 
很 大 的 努力 去 避免 它 ， 程 序 中 的 错误 往往 还 是 会 存在 的 。AT&T 发 生 过 一 个 戏剧 性 的 例子 ， 控 制 114 
开关 站 软件 中 有 一 个 错误 ， 从 1989 年 12 月 安装 起 到 1990 年 1 月 15 日 都 未 能 发 现 ， 在 这 段 时 间 里 ， 每 9 
个 小 时 ， 一 组 独特 的 环境 造成 了 大 约 五 百 万 次 呼叫 ， 产 生 了 不 必要 的 阻塞 。 
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. 假设 有 一 台 使 用 播 入 排序 算法 编程 的 机 器 ， 每 秒 钟 平 均 排序 100 个 名 字 的 列表 ， 佑 算 -一 下 对 1000 个 名 


字 排 序 需要 多 长 时 间 ? 对 10 000 个 名 字 排 序 呢 ? 

为 下 面 的 每 种 类 型 列 出 一 个 算法 的 例子 ，B@(lgm、@(a0 和 Gor2)。 

将 下 列 函 数 撤 有 效 性 递减 顺序 排列 ，@Uz、B@(1gm、@(mD 和 Be。 

考虑 下 面 的 问题 ， 并 给 出 答案 。 看 看 猜测 的 答案 是 正确 还 是 错误 。 为 什么? 

问题 :假设 一 个 盒子 里 有 3 张 卡片 ， 其 中 一 张 两 面部 涂 成 黑色， 另 一 张 两 面 都 涂 成 红色 ， 第 三 张 一 面 . 
涂 成 黑色 ， 另 一 面 涂 成 红色 。 抽 出 其 中 一 张 卡片 ， 只 元 许 看 一 面 ， 那 么 另 一 面 与 你 所 看 到 的 颜色 相同 
的 概率 有 多 大 ? 

狂 测 答案 : 1/2。 假 设 你 看 到 的 卡片 的 那 一 面 是 红色 的 〔 如 果 是 黑 的 ， 讨 论 结果 也 是 -- 样 的 ，。 只 
两 张 卡片 有 红色 的 一 面 ， 因 此 你 看 到 的 卡片 是 两 张 中 的 -一 张 。 这 两 张 中 的 一 张 背面 也 是 红色 ， 另 一 张 
背面 就 是 黑色 ， 因此 你 看 到 的 卡片 背面 是 红色 的 概率 和 是 黑色 的 概率 一 样 大 。 


下 面 的 程序 段 用 来 计算 两 个 正 整数 〔 一 个 除数 ， 一 个 被 除数 ) 的 商 《 不 考虑 余数 ) ， 方 法 是 计算 从 被 


除数 中 可 以 减 去 除数 ， 直 到 比 除 数 小 时 减 的 次 数 。 例 如 ，71/3 应 该 等 于 2， 因为 3 可 以 从 7 中 减 两 次 。 这 
个 程序 正确 吗 ? 证 明 你 的 结论 。 


LOuUnt 一 0; 
Remainder Dividend， 
repeat ( Remainder 一 Remainder - Divisor 
(ount - Count +1) 
until (Remainder < Divisor ) 
Quotient 一 Count. 
(Count、Remainder、Dividend、 Divisor 和 Quotient 分 别 表 示 计 数 、 祭 数 、 被 除数 ， 除 数 和 商 。 ) 


下 面 的 程序 是 通过 累计 X 个 Y 的 总 和 的 方法 来 计算 X 和 Y 非 负 整数 的 积 。 也 就 是 说 ，3 乘 以 4 就 是 计算 3 


个 4 的 总 和 。 下 面 这 段 程序 对 吗 ? 证 明 你 的 结论 ， 
Product 一 Y; 
LOunt 二 1: 
while ( Count < X ) do 
( Product 一 Product + Y， 
Count 一 Count +1) 


假设 前 提 条 件 是 N 的 值 是 一 个 正 整 数 ,建立 一 个 循环 不 变量 , 使 得 若 下 面 的 合 程 终止 sum 等 于 1+2+…+N， 


suUm 一 避 ; 
攻 一口 ; 
while (K<N ) do 
(长 一 长 二 1; 
SUm 盖 SUm 二 K)) 
讨论 该 程序 终止 时 的 真正 结果 。 


- 假设 一 个 程序 以 及 执行 它 的 硬件 都 已 正式 化 地 验证 过 是 准确 的 ， 那 么 这 样 就 能 保证 准确 位 四 7 
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〈 带 * 的 题目 涉及 选读 小 节 的 内 容 。) 
1 给 出 一 组 步骤 的 例子 ， 使 它 符合 5$.1 节 首 段落 中 给 出 的 算法 非 正式 定义 ， 但 不 符合 5.I 节 中 
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| 
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tn 


ee 


= 中 
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10. 


给 出 的 正式 定义 。 
解释 被 提议 的 算法 的 歧义 性 和 算法 表示 的 歧 
义 性 的 区 别 。 


. 描述 如 何 使 用 原 语 来 帮助 我 们 消除 算法 表示 


中 的 此 义 性 。 


, 选择 一 个 你 比较 部 悉 的 科目 , 并 设计 一 种 伪 代 


码 ， 能 够 描述 该 类 题目 的 解决 方案 。 其 中 ， 要 
描述 你 要 使 用 的 原 语 以 及 用 于 表示 它们 的 语 
法 .《 如 果 你 想 不 出 一 个 科目 , 可 以 考虑 体育 、 
艺术 或 者 飞行 器 等 方面 的 问题 。) 
下 面 的 程序 从 严格 意义 上 讲 表示 一 个 算法 
吗 ? 为 什么 ? 
Count 一 0; 
while ( Count not 5 ) do 

(Count 一 Count+z) 


从 什么 意义 上 讲 ， 下 列 3 个 步骤 并 不 构成 一 个 

算法 ， 

第 1 步 : 在 直 坐 标 系 中 从 点 (2.5) 到 点 (6,11) 之 间 画 
一 条 直线 。 

第 2 步 , 在 直角 坐标 系 中 从 点 (1.3) 到 (3,6) 之 间 画 一 条 
直线 。 

第 3 步 ， 以 上 面 两 条 线 的 变 点 为 中 心 , 画 一 个 半径 为 
2 的 圆 。 


. 用 repeal 结 构 代 替 wpie 结 构 重 写 下 面 的 程序 


段 ， 确 避 它 能 够 显示 出 与 原 程 序 相同 的 值 。 
Count 一 ; 
while tt Count<7 ) do 

( 打印 赋 给 Count 的 值 并 且 


Lount 一 COunmt 二 1) 


. 利用 while 结 构 代 蔡 repeat 结 构 重 写 下 面 的 程 


序 段 ， 确 保 它 能 够 显示 出 与 原 程序 相同 的 值 。 
LOunt 一 1; 
repeat 
( 打印 赋 给 Count 的 值 并 且 
Count* 一 Count+1 ) 
until( Count=5 ) 


要 把 以 

repeat (...) Until (...) 

形 却 表达 的 后 油 试 循环 转换 为 以 

do (...) While (...) 

形式 表达 的 等 价 的 前 测试 循环 ， 和 上 样 进行 ? 


了 丽 计 一 个 算法 ， 对 于 数字 0, 1,2, 3, 4, 5, 6, 7, 8， 


9 的 一 个 排列 ， 它 能 够 产生 一 个 新 的 排列 使 得 
其 数值 是 这 些 数字 所 有 可 能 的 排列 中 仅 比 原 


2. 
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排列 的 数值 大 (或 者 报告 不 存在 更 大 的 排列 ) ， 
因此 5647382901! 算 法 将 产生 5647382910 排 列 。 


. 设计 一 个 算法 ， 来 找 出 一 个 正 整 数 的 所 有 因 


子 。 例 如 ， 对 于 整数 12， 该 算法 得 到 1、2、3、 
4、56 和 12。 


， 设计 一 个 算法 ， 来 计算 从 1700 年 1 月 1 日 起 的 任意 


一 天 是 星期 几 。 例 如 ，2001 年 8 月 17 日 是 星期 五 。 


. 正式 程序 设计 语言 和 伪 代 码 的 区 别 是 什么 ? 
.语法 和 语义 之 间 的 区 别 是 什么 ? 
. 下 面 是 一 个 传统 的 十 进 制 加 法 ,每 个 字母 表示 


不 同 的 数字 。 问 这 些 字 母 表示 什么 数字 ? 你 是 
坚 样 “入 门 ” 的 ”? 
其 平 之 
十 竺 同和 至 
2ZTYZW 
下 面 是 一 个 传统 的 十 进 制 乘法 , 每 个 字母 表示 
不 同 的 数字 。 问 这 些 字母 表示 什么 数字 ? 你 是 
怎样 “入 门 ” 的 ? 
蕊 里 
冯 于 其 
其 至 
糙 机 
WVY 


- 下 和 面 是 一 个 二 进 制 加 法 , 每 个 字母 表示 不 同 的 


数字 。 问 哪 个 字母 表示 1， 哪 个 字母 表示 03? 你 
是 怎 样 “ 人 入门” 的 ? 
YXX 


十 外 平 其 
总 生 芋 业 


. 有 4 个 勘探 者 ， 他 们 只 有 一 个 手电 简 ， 并 且 必 


须 走 过 控 烘 的 坑道 .他 们 最 多 可 以 两 个 人 一 起 
通过 ， 并 且 其 中 一 个 人 必须 拿 着 手电 。 这 4 个 
采矿 者 分 别 叫 Andrews、Blake 、Johnson 和 


Kelly, 他 们 单独 通过 坑道 的 时 间 分 别 是 1 min、 


2min、5 min 和 8 min。 当 两 个 人 一 起 通过 坑道 
时 , 要 以 速度 慢 的 人 的 速度 为 准 , 如 何 安排 才 


能 使 这 4 人 在 15 min 内 通过 坑道 ? 解释 你 是 怎 


样 “ 入 门 ” 的 ? 


. 有 两 个 酒杯 , 一 大 一 小 , 先 往 小 酒杯 中 倒 满 酒 ， 


再 把 小 酒杯 中 的 酒 倒 入 大 酒杯 ， 然 后 ,把 小 酒 
杯 中 倒 广 水 ， 再 把 小 酒杯 中 的 水 倒 入 大 酒杯 ， 
在 大 酒杯 中 均匀 搅拌 , 再 把 混合 液体 倒 回 到 小 
订 杯 ， 直 到 倒 满 ,请问 此 时 大 酒杯 中 的 水 和 小 
酒杯 中 的 酒 哪个 多 ? 解释 你 是 怎样 “入 门 ” 的 ? 
两 只 密 蜂 ， 一 只 叫 罗 密 欧 ， 一 只 叫 朱丽叶 ， 它 


ha 
| 
如 
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二 下 


们 住 在 不 同 的 蜂 房 , 但 是 它们 相爱 了 。 在 一 -个 
无 风 的 春天 ， 它 们 同时 离开 各 自 的 蜂 房 来 相 
会 ， 它 们 相遇 的 地 点 在 距离 最 近 的 蜂 房 30 m 
的 地 方 , 但 它们 都 没 看 到 对 方 , 因此 继续 按 各 
目的 方向 飞 ， 直到 飞 到 对 方 的 蜂 房 ， 发 现 对 方 
没有 在 家 , 则 开始 返回 , 在 距离 最 近 蜂 房 20 m 
的 地 方 , 它们 又 相遇 了 , 这 次 他 们 看 到 了 对 方 ， 


愉快 地 去 野餐 了 .请 问 这 两 个 峰 房 的 距离 是 多 


少 ? 你 是 如 何 “ 信 门 ” 的 ? 


. 设计 一 个 算法 , 给 定 两 个 字符 串 , 检查 第 一 个 


字符 串 是 否 是 第 二 个 字符 串 的 一 部 分 ? 


- 下 面 这 个 算法 是 用 来 打印 已 知 的 斐 波 那 契 序 


列 的 开始 部 分 , 请 标识 这 个 循环 体 。 哪儿 是 循 
环 控 制 的 初始 化 步骤 ? 哪儿 是 修改 步骤 ? 哪 
儿 是 测试 步骤 ? 产生 的 数字 列表 是 什么 ? 
Last 一 口 ; 
Current。1: 
While(Current<T00)da 
(打印 赋 给 Current 的 值 : 
Termp 一 Last: 
Last* 二 Current ; 并 且 
Lurrent 一 Last+Termp) 


: 在 下 面 的 算法 中 , 如 果 输 入 值 分 别 以 0 和 1 开 


始 ， 显 示 的 数 的 序列 是 什么 ? 


procedure Mysterywrite (Last， Current 
if Current<100 ) then 
( 打印 赋 给 Current 的 值 . 
Temp 一 Current+Last: 
应 用 Mysterywrite 到 Current 和 Temp ) 


. 修改 上 一 问题 中 的 过 程 MysteryWrite， 使 得 


显示 的 数 的 序列 次 序 相 反 。 
如 果 用 二 分 搜索 算法 〈 图 $-14) 从 给 定 的 字母 
列表 A、B、C、D、B、F、G、H、I、J、 扩 、 
上 、M、N、O 碍 找 出 J， 那 么 哪些 字母 会 被 查 
到 ? 如 果 要 查找 Z 呢 ? 
一 般 来 说 , 用 顺序 搜索 法 在 有 6000 项 的 列表 中 
搜索 ， 目 标 值 与 列表 项 进行 比较 的 次 数 是 多 
少 ? 如 果 用 二 分 搜索 法 呢 ? 
确定 下 列 每 个 循环 语句 的 终止 条 件 。 
a. WhiletCount<5jdo 

( ) 
brepPeat 

| 】 


2 


29. 


30. 


je 


3 


32. 


33. 


34. 


untilfCounmt=1) 
c. WhilettCount<5)and(Total<56))do 
| ] 


标识 下 列 循环 结构 的 循环 体 , 计算 它 执行 了 多 
少 次 。 如 果 把 测试 条 件 改变 为 while(Count not 
6)， 会 有 什么 情况 发 生 ? 


Count 一 1 : 
while ( Count not 7 ) do 
( 打印 赋 给 Count 的 值 并 且 
Count 一 Count+3 ) 


如 果 在 计算 机 上 执行 下 面 这 个 程序 , 你 觉得 可 
能 会 发 生 什 么 问题 ? 〔 提 示 ;， 想 想 浮 点 算法 可 
能 导致 的 溢出 问题 。) 


Count 一 one-tenth， 
repeat 
( 打印 赋 给 Count 的 值 并 且 
Lount 一 Count + One-tenth ) 
untiltCount = 1) 


衣 计 一 个 递归 的 欧 几 里 得 算法 。 (5.2 节 的 第 3 
题 。 了 


- 假设 在 Test1 和 Test2( 下 面 已 经 定义 了 ) 输 入 


1 值 ， 那 么 两 个 程序 的 输出 结果 有 什么 区 别 ? 


procedure Test1{ Count ) 
if( Count not 5 ) 
then ( 打印 赋 给 Count 的 值 并 且 将 Test1 应 用 于 
Lounmnt+1 ) 
procedure Test2 (Count ) 
和 f( Count not 5) 
then ( 将 Test2 应 用 于 Count +1 并 且 打 印 赋 给 
Count 的 值 ) 


狼 证 上 一 题 中 的 例 程 的 控制 机 制 中 的 重要 组 、 
成 要 素 。 具 体 而 言 , 什么 条 件 会 使 这 一 过 程 终 
止 ? 过 程 的 哪 一 部 分 可 以 修改 终止 条 件 ? 哪 
一 部 分 是 过 程 的 初始 化 状态 ? 

确定 下 面 的 递归 过 程 的 终止 条 件 。 


procedure XXXIN) 
if (N=5)then( 将 XXX 过 程 应 用 于 N + T) 


当下 面 的 过 程 MysteryPrint 的 输入 值 为 3 时 ， 
记录 显示 的 值 。 
procedure MysteryPrint (N) 


ffIN>DO)theni 打印 N 的 值 并 将 MysteryPrint 过 
程 应 用 于 N-2) 
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3 ， 


3 
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38. 


3 


6. 


了 


打印 N + 1 的 值 


当下 面 的 过 程 MysterypPrint 的 输入 值 为 2 时 ， 
记录 显示 的 值 。 
procedure MYysteryPrint (N) 
计 ( M>0OD) 
then( 打 印 N 的 值 并 将 MysteryPrint 过 程 应 用 
于 M-2) 
elset 打 印 N 的 值 并 且 
计 (NMN>-] ) 
then (将 MysteryPrint 过 程 应 用 于 
N+1 


设计 一 个 算法 ,来 〈 按 递增 顺序 ) 生成 其 素数 

因子 为 2 和 3 的 正 整 数 的 序列 。 也 就 是 说 ,你 的 

程序 应 该 产生 这 样 的 序列 ; 2, 3, 5, 6, 9, 12, 16， 

18, 25, 27…。 你 该 怎样 设计 ? 

按照 列表 Alice、Byron、Carol、Duane、Elaine、 

Floyd、Gene、Henry 和 Tris， 回 答 下 列 问题 。 

a， 哪 种 搜索 算法 (二 分 法 或 顺序 法 ) 查 找 Gene 
更 快 ? 

b. 上 哪 种 搜索 算法 (二 分 法 或 顺序 法 ) 查 找 Alice 
更 快 ? 

c。， 哪 种 搜索 算法 〈 二 分 法 或 顺序 法 ) 能 够 比 
锐 快 地 检测 出 名 字 Bruce 不 存在 ? 

d， 哪 种 搜索 算法 《〈 二 分 法 或 顺序 法 ) 能 够 比 
较 快 地 检测 出 名 字 S$ue 不 存在 ? 

e， 如 果 用 顺序 搜索 方法 查找 Elaine， 会 进行 多 
少 次 比较 ?如果 用 二 分 搜索 呢 ? 

0 的 阶乘 定义 为 1。 正 整数 的 阶乘 定义 为 整数 本 

身 和 比 自 己 小 的 非 负 整 数 的 阶乘 。 我 们 用 记号 

#! 来 表示 整数 m 的 阶乘 ， 也 就 是 说 3 的 阶乘 〈 写 

作 3!) 是 3X(20=3X(CXx(ID3XGCX(X 

(=3Xx(2Xx(LX1))=6。 请 设计 一 个 递归 算 

庄 来 计算 任意 整数 的 阶乘 。 


. a. 假设 你 必须 给 一 个 有 5 个 名 字 的 列表 排序 ， 而 


且 你 已 经 有 一 个 算法 能 给 4 名 字 的 列表 排序 。 
请 利用 已 经 设计 好 的 算法 的 优点 来 设计 一 个 
新 的 能 给 有 5 个 名 字 的 列表 排序 的 算法 。 
b. 基于 问题 a 中 使 用 的 技术 ， 设 计 一 个 能 给 任 
意 长 的 名 字 列 表 排 序 的 递归 算法 。 
称 为 汉 诺 塔 的 难 古 有 3 根 柱子 ， 每 个 柱子 都 可 
以 放置 若干 个 大 小 不 同 的 环 , 这 些 环 自 底 向 上 
再 径 越 来 越 小 。 这 个 问题 是 , 如何 将 一 个 柱子 
上 3 个 排列 好 的 环 移 到 另 一 个 柱子 上 ， 规 则 是 
每 次 只 能 移动 一 个 环 , 较 大 的 环 不 能 放 在 较 小 
的 环 上 面 。 我 们 看 到 , 如 果 总 共 就 只 有 一 个 环 ， 


41. 


] 


42. 


二 3. 


二 5. 


堵 么 问题 就 非常 容易 。 其 次 ,， 当 你 要 移 若 干 个 
环 的 时 候 , 如 果 你 把 除了 最 大 的 环 之 外 的 所 有 
环 痢 搬 到 男 一 个 柱子 上 , 那么 现在 可 以 把 这 个 
最 大 的 环 搬 到 第 三 根 柱子 上 , 然后 把 其 余 的 环 
搬 到 它 上 面 。 利 用 这 个 分 析 , 开发 一 个 递归 算 
法 来 解决 任意 环 数 的 汉 诺 塔 问题 。 





解决 汉 诺 塔 问题 的 另外 一 个 方法 是 把 3 根 柱子 
想象 成 一 个 圆圈 排列 ， 每 根 柱 子 在 4 点 钟 、8 点 
钟 、12 点 钟 的 位 置 上 。 开 始 时 ， 一 根 柱子 上 的 
环 从 小 到 大 以 1, 2. 3 依次 编号 。 看 一 根 柱子 上 面 
最 大 的 环 ， 如 果 它 的 编号 是 奇数 ， 允 许 它 按照 
逆 时 针 方向 搬 到 下 一 根 柱 子 上 ， 如 果 它 的 编号 
是 偶数 ， 则 允许 它 按照 道 时 针 方向 搬 到 下 一 根 
柱子 上 《只 要 不 把 较 大 的 环 放 在 较 小 的 环 的 上 
和 面 ) 。 在 这 个 限制 条 件 下 ， 当 几 个 柱子 上 有 可 
搬 的 环 时， 总 是 搬 编号 最 大 的 环 。 按 照 这 个 思 
路 ， 开 发 一 个 非 递归 算法 来 解决 汉 诺 塔 问题 。 


] 


必 





了 


开发 两 个 算法 , 用 来 显示 一 个 工人 30 天 期 间 的 
日 薪 ， 要 求 一 个 算法 是 基于 循环 结构 ， 另 一 个 
基于 递归 结构 .这 个 工人 每 天 的 工资 是 前 一 天 
的 两 倍 。 如 果 你 在 计算 机 上 实现 你 的 算法 , 那 
么 在 数 的 存储 上 面 会 遇 到 什么 问题 ? 

开发 一 个 算法 来 求 一 个 正 数 的 平方 根 。 开 始 
时 ， 把 这 个 正 数 本 身 作 为 根 的 第 一 个 猜测 值 ， 
以 后 按 下 列 方法 重复 地 产生 新 的 猜测 值 ; 原 正 
数 除 以 现在 的 猜测 值得 到 的 商 , 取 这 个 商 和 该 
狂 负 值 的 平均 值 作为 下 一 个 猜测 值 .分 析 对 这 
个 重复 过 程 的 控制 , 特别 是 ,重复 的 终止 条 件 
是 什么 ? 


- 设计 一 个 算法 ， 列 出 一 个 由 5 个 不 同 字符 组 成 


的 字符 串 中 的 字符 的 其 他 可 能 的 排列 。 

设计 一 个 算法 , 在 给 定 的 名 字 列 表 中 找到 最 长 
的 名 字 。 如 果 列 表 里 有 多 个 “最 长 ”的 名 字 ， 
那么 你 的 算法 是 如 何 解决 的 。 特别 是 ,如 果 列 
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表 里 的 所 有 名 字 的 长 度 都 一 样 , 你 的 算法 又 是 
如 何 解决 的 ? 


. 设计 一 个 算法 ， 在 对 于 一 个 有 5 个 或 更 多 表 项 


的 列表 ， 在 不 对 整个 列表 进行 排序 的 情况 下 ， 
找 出 5 个 最 小 的 和 5 个 最 大 的 表 项 。 
对 名 字 Brenda 、Doris 、Raymond 、 Steve 、 
Timothy 和 William 进 行 排序 ， 要 求 在 使 用 揪 入 
排序 算法 (图 $-11) 进 行 排序 时 比较 次 数 最 少 。 
对 于 有 4000 个 名 字 的 列表 , 使 用 二 分 搜索 算法 
(图 5$-14) 时 最 多 查 问 多 少 个 表 项 ? 使 用 顺序 
搜索 算法 《图 $-6) 呢 ? 试 对 二 者 进行 比较 。 
使 用 大 昌 记 号 对 传统 的 小 学 加 法 和 乘法 的 算 
法 进行 分 类 。 也 就 是 说 ， 如 果 两 个 有 nm 个 数字 
的 数 相 加 , 那么 要 做 多 少 次 一 位 的 加 法 ? 如 果 
两 个 有 m 个 数字 的 数 相 和 匀 ， 那 么 要 做 多 少 次 一 
位 的 乘法 ? 
有 了 时 对 一 个 问题 稍 作 变动 就 可 能 使 它 的 解 的 
形式 发 生 重大 改变 。 例 如 , 设计 一 个 简单 的 算 
法 来 解决 下 述 问题 ， 并 用 大 @ 记号 进行 归 类 ， 
把 一 群 人 分 为 两 个 小 组 (人 数 不 限 ) ， 使 得 两 
个 小 组 成 员 的 年 龄 的 总 和 的 差 尽 可 能 大 。 
现在 把 问 题 改 为 ， 使 得 两 个 小 组 成 员 的 年 龄 的 
总 和 的 差 尽 可 能 小 , 再 利用 大 日 记号 进行 归 类 。 
从 下 面 的 列表 中 找 出 一 组 数 ， 使 其 总 和 等 于 
3165。 你 的 解法 效率 如 何 ? 
26, 39, 104, 195, 403, S04, 793 995 1]156,，1677 
下 面 例 程 中 的 循环 会 终止 吗 ?解释 你 的 回答 。 
如 果 这 个 例 程 实际 在 一 台 计 算 机 上 执行 〈 见 
1.7 往 ) ， 说 明 可 能 会 发 生 的 情况 。 
基 < 1 
Y- 一 1/72; 
While ( X 不 等 于 0 ) do 

【其 = 基 一 阅 : 

YY 一) 


.下 面 的 程序 段 是 用 来 计算 两 个 非 负 整数 X 和 Y 


的 乘积 的 ， 方 法 是 累计 X 个 Y 的 和 。 也 就 是 说 ， 
3 乘 以 4 是 通过 累计 3 个 4 得 到 。 这 个 程序 段 正确 
玛 ? 为 什么 ? 


54. 


0 
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Product<0， 

Count 一 0: 

repeat(Product 一 Product + Y， 
(Lount< Count 十 1) 

untilCount = 为) 


下 面 的 程序 段 是 用 来 报告 正 整数 X 和 Y 中 哪个 
大 的 ， 这 段 程序 正确 吗 ? 为 什么 ? 


Difference -一 X-Y 

if Difference 是 正 数 ) 
then (print “X is bigger than Y9) 
else (Print "Y is bigger than X9) 


下 列 的 程序 段 是 用 来 从 一 个 非 空 的 整数 列表 中 
找到 最 大 的 项 的 。 这 个 程序 段 正确 吗 ? 为 什么 ? 


TestValue 一 first list entry; 
CurrentEntry *first list entry; 
while ( CurrentEntry 不 是 最 后 一 项 ) do 
(f (CurrentEntry > TestValue ) 
then( TestValue~CurrentEntry ) 
CurrentEntry 一 下 一 个 表 项 ) 


标识 图 5-6 表 示 的 顺序 搜索 算法 的 前 提 条 
件 。 为 这 个 程序 里 的 while 结 构 确 定 一 个 循 
环 不 变 式 ， 当 它 与 终止 条 件 结合 时 ， 就 意 
味 着 ， 在 该 循环 终止 时 该 算法 将 正确 地 报 

告 成 功 或 失败 。 
b， 给 出 一 个 论据 说 明 图 5-6 里 的 while 循 环 事 

实 上 是 会 终止 的 。 

基于 赋 给 X 和 Y 的 值 是 非 负 整 数 的 前 提 条 件 ， 
标识 下 述 的 while 结 构 里 的 循环 不 变 式 ， 当 它 
与 终止 条 件 结合 时 ， 就 意味 着 ， 与 Z 相 联系 的 
值 在 循环 终止 时 一 定 是 X-Y。 


万 < 其 ， 

凡 0; 

While (JJ<Y ) do 
(一 Z- 1 ; 
一 上 1) 
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下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 . 回答 这 些 问 题 不 


是 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问 题 都 标准 如 一 。 


1. 现在 验证 复杂 程序 的 正确 性 几乎 是 不 可 能 的 ， 在 这 种 情况 下 ， 柱 序 的 开发 者 是 否 该 为 检 
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一 


但 出 错误 做 些 什么 ? 

2. 假设 你 有 一 个 很 好 的 想法 ， 并 把 它 开 发 成 一 个 为 很 多 人 所 用 的 产品 ， 而 这 已 经 耗费 了 你 
一 年 的 时 间 和 50 000 美 元 。 可 是 ， 该 产品 的 最 终 形式 可 能 被 许多 没有 向 你 购买 该 产品 的 
人 所 使 用 。 为 了 获得 补偿 你 具有 哪些 权利 ? 盗版 计算 机 软件 合法 吗 ? 音乐 和 电影 呢 ? 

3. 假设 一 个 软件 包 非 常 昂 贵 ， 超 过 了 你 的 预算 ， 那 么 复制 这 个 软件 供 自己 使 用 是 否 有 违 道德 ? 
〈 竺 竞 ， 因 为 你 无 论 如 何 都 不 可 能 去 购买 这 个 软件 包 ， 所 以 你 没有 在 购买 上 欺骗 供应 商 。) 
4. 河 沂 、 和 木林、 海洋 等 的 所 有 权 早 已 争论 不 体 ， 那 么 在 什么 意义 上 应 该 给 某 人 或 某 机 构 一 

个 算法 的 所 有 权 ? 

5. 有 些 人 觉得 新 算法 是 被 发 现 的 ， 而 另 一 些 觉得 新 算法 是 被 创建 的 。 你 同意 哪 种 说 法 ? 这 
些 不 同 观点 会 导致 关于 算法 的 所 有 权 和 所 有 权 的 不 同 结 论 吗 ? 

6. 设计 一 个 实现 非法 行为 的 算法 是 道德 的 吗 ? 它 与 该 算法 是 否 执行 有 关 吗 ? 对 于 开发 出 这 
种 算法 的 人 具备 拥有 该 算法 的 所 有 权 吗 ? 如 果 是 ， 那 个 人 应 该 拥有 哪些 权利 ? 算法 的 所 
有 权 与 该 算法 的 目的 有 关 吗 ? 大 肆 宣 扬 和 散布 破解 安全 的 技术 是 道德 的 吗 ? 它 与 破解 的 
呈 容 有 关 吗 ? 

7. 一 个 作家 会 获得 为 一 部 小 说 支付 的 电影 版 权 费 , 尽管 这 个 故事 在 电影 版 本 中 经 常 被 改动 。 

一 个 故事 要 改变 成 一 个 不 同 的 故事 ， 它 必须 改变 多 少 呢 ? 对 于 算法 来 说 ， 一 个 算法 要 变 
成 一 个 不 同 的 算法 ， 必 须要 对 这 个 算法 做 多 少 改动 呢 ? 

: 面 癌 18 个 月 或 更 小 儿童 的 教育 软件 现在 正在 销售 。 支 持 者 认为 ， 这 些 软件 提供 了 图 像 和 

音 ， 否 则 对 于 许多 孩子 来 说 是 无 用 的 ;反对 者 认为 ， 它 是 父母 子女 之 间 交 流 的 替代 品 。 
你 有 什么 看 法 ? 基于 你 的 看 法 ， 当 你 并 没有 对 这 软件 了 解 更 多 的 情况 下 你 会 采取 行动 
吗 ? 如 果 是 ， 你 会 怎么 做 ? 
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重 我 们 来 学 习 程序 设计 语言 。 我 们 的 目标 并 不 是 学 习 一 门 特定 的 程序 设计 语言 ， 而 
征 学 习 与 程序 设计 语言 相关 的 一 些 知识 。 我 们 将 要 考查 程序 设计 语言 及 其 相关 联 的 
方法 之 间 的 共性 和 个 性 。 

如 采 人 们 不 得 不 使 用 机 器 语言 来 直接 表达 算法 ， 那 么 要 想 开发 像 操 作 系统 、 网 络 软件 和 大 
王 应 用 软件 这 样 的 复杂 软件 系统 基本 上 是 不 可 能 的 。 我 们 至 少 可 以 这 人 么 说 ， 在 试图 去 组 织 和 设 
计 一 个 复杂 系统 的 同时 ， 处 理 这 些 与 机 器 语言 有 关 的 繁琐 而 复杂 的 细节 必定 是 一 个 很 困难 的 工 
作 。 因 此 ， 关 似 伪 代 码 的 程序 设计 语言 开发 出 来 了 ， 它 使 得 算法 可 以 以 这 样 的 形式 来 表达 ， 既 
合 于 人意， 又 能 够 很 方便 地 转换 为 机 器 指令 。 本 章 ， 我 们 的 目标 是 考查 计算 机 科学 领域 内 这 些 
程序 设计 语言 的 设计 和 实现 。 


本 -本 环 和 下 最 让 ， 生生 和 下 夭 天 下 天 于 攻 和 向 生生 下 硬币 下 1 -于 世 且 有 衣 汪 计生 站 村 池 E 二 下 关 村 本 下 二 可 必 


6.1 ”历史 回顾 


我 们 从 追溯 程序 设计 语言 发 展 的 历史 开始 。 
6.1.1 早期 程序 设计 语言 


正如 和 在 第 2 章 学 过 的 ， 现 代 计 算 机 的 程序 由 采用 数字 编码 的 指令 序列 组 成 。 这 样 的 编码 系 
统称 为 机 器 语言 。 但 是 ， 用 机 器 语言 编写 程序 是 一 项 部长 乏味 的 任务 ， 而 且 经 常 出 错 ， 在 工作 
完成 之 前 ， 这 些 错误 必须 被 找到 和 更 正 〈 这 个 过 程 称 为 调试 《debugging ) )。 

20 世纪 40 年 代 ， 研 究 人 员 为 了 简化 程序 设计 过 程 开发 了 记号 系统 ， 使 得 指令 可 以 用 助 记 
符 表 示 ， 不 再 使 用 数字 形式 。 例 如 ， 指 令 


把 寄存 器 5 的 内 容 送 入 寄存 器 6 
用 第 2 重 介绍 的 机 器 语言 表示 为 


入 癌 与 白 
而 使 用 助 记 符 系统 时 ， 可 以 表示 为 
MUOWVW 及 5 ， 及 日 
再 举 一 个 更 大 一 点 的 例子 ， 机 器 语言 例 程 


5 日 妇 
66D 
5056 
3 有 6 下 
c000 


是 将 仓储 单元 6C 和 6D 的 内 容 相 加 ， 将 结果 存 入 地 址 6E〔 见 2.2 节 图 2.7)， 使 用 助 记 符 ， 上 面 
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的 例 程 可 以 表达 为 
LD 及 ， 了 71 所 
ED 及 日 ， 号 拉 工 切记 工 六 亲人 杞 工 可 所 
RDDI RDO， 妨 5 有 后 


呈 T 及 口 ， 正品 七 喜 1 白 所 二 
再 工 下 


(这 里 ， 我 们 使 用 了 LD 、ADDI、ST 和 HLT 表 示 装 入 、 相 加 、 存 储 和 人 停机。 而且， 我 们 用 描述 
性 名 字 Price、 Shippingcharge 和 Totalcost 相 应 表示 在 地 址 为 6C、6D 和 6E 的 存储 单元 ， 这 
蔡 摘 述 性 的 名 字 称 为 标识 符 《〈identifier))。 注 意 ， 助 记 符 形式 虽然 有 不 足 之 处 ， 但 是 与 数字 形 
式 相 比 ， 它 仍然 是 表达 例 程 售 义 较 好 的 方法 。 

一 旦 这 种 助 记 符 系 统 建立 起 来 ， 就 开发 了 称 为 汇编 器 (assembler) 的 程序 来 将 用 助 记 符 形 
式 表 达 的 程序 转换 为 机 器 语言 。 以 此 方式 ， 人 们 可 以 使 用 这 种 助 记 符 开发 程序 ， 然 后 再 用 汇编 
器 把 它 转换 为 机 器 语言 ， 而 不 必 直 接 使 用 机 器 语言 去 开发 程序 。 

表示 程序 的 助 记 符 系统 一 起 称 为 汇编 语言 (assembly language)。 当 汇编 语言 最 初 被 开发 
出 来 时 ， 它 代表 了 在 研究 更 好 的 程序 设计 技术 方面 迈 出 了 巨大 一 步 。 实 际 上 ， 汇 编 语 言 的 出 
现 征 单价 性 的 事件 ， 以 至 于 它们 被 称 为 第 二 代 程 序 设计 语言 ， 而 第 一 代 程 序 语言 是 机 器 语言 
本 身 。 

上 尽管 第 二 代 语 言 与 机 器 语言 相 比 有 不 少 的 优势 ， 但 是 它们 还 是 有 一 些 不 足 一 一 它们 没有 提 
供 最终 的 程序 设计 环境 。 毕 竟 ， 在 汇编 语言 中 使 用 的 原 语 基本 上 和 与 之 相对 应 的 机 器 语言 中 的 
相同 ， 这 两 者 的 不 同 仅仅 体现 在 用 于 表示 它们 的 语法 上 。 因 此 ， 用 汇编 语言 写 的 程序 必然 依赖 
于 机 器 ， 也 就 是 说 ， 程 序 中 使 用 的 指令 都 是 遵循 特定 的 机 器 特性 来 编写 的 。 用 汇编 语言 写 的 程 
序 不 能 方便 地 移植 到 另 一 种 机 器 上 ， 这 是 因为 这 个 程序 必须 重 写 以 遵循 这 种 新 机 器 的 寄存 器 配 
置 和 指令 系统 。 

汇编 语言 的 另 一 个 缺点 是 ;程序 员 尽 管 不 再 需要 使 用 数字 形式 来 编写 代码 ， 但 仍 不 得 不 从 
机 器 语言 的 角度 去 思考 。 这 种 情况 很 类 似 于 房屋 设计 一 一 我 们 毕竟 还 是 要 根据 木板 、 钉 子 和 夸 
块 等 来 设计 。 确 实 ， 在 实际 的 房屋 建造 中 ， 最 后 的 确 还 需要 一 个 基于 这 些 基 本 元 素 的 描述 ， 但 
是 如 果 我 们 考虑 根据 诸如 房间 、 窗 户 和 门 等 的 更 大 一 些 的 单元 来 设计 ， 设 计 过 程 应 该 会 更 简单 
一 些 。 

傈 而 言 之 ， 最 终 构建 产品 所 使 用 的 基本 原 语 不 一 定 是 在 设计 过 程 中 使 用 的 原 语 。 这 个 设计 
过 程 应 该 更 适合 使 用 更 高 级 的 原 语 一 一 每 一 个 原 语 都 代表 了 一 个 与 产品 的 主要 特性 相关 的 概 
念 。 一 且 设 计 过 程 结束 ， 这 些 原 语 就 能 够 被 翻译 成 与 实现 的 细节 相关 的 较 低 级 的 概念 。 

根据 这 种 藻 理 , 计算 机 科学 家 开始 开发 比 低 级 的 汇编 语言 更 易于 开发 软件 的 程序 设计 语言 。 
结果 了 驶 出 现 了 第 三 代 程 序 设 计 语言 ， 它 不 同 于 早期 的 程序 设计 语言 ， 因 为 它 的 原 语 不 仅 是 更 高 
级 列 的 《它们 代表 比较 多 的 指令 ) 而 且 是 机 器 无 关 (machine independent) 的 《它们 不 依赖 于 特 
定 的 计算 机 的 特性 )。 一 个 著名 的 早期 程序 设计 语言 就 是 FORTRAN (FORmula TRANslator )， 
它 是 为 科学 和 工程 应 用 开发 的 ， 还 有 COBOL (Common Business-Oriented Language)， 由 美国 
海军 开发 ， 用 于 商业 应 用 。 

一 般 来 说 ， 第 三 代 程 序 设 计 语 言 的 方法 就 是 标识 一 个 更 高 级 的 原 语 的 集合 〈 基 本 上 和 我 们 
在 第 $ 章 中 开发 的 伪 代 码 的 思路 一 致 )， 而 软件 要 使 用 这 些 原 语 来 开发 。 每 一 个 原 语 要 能 够 当 作 
相对 应 的 机 器 语言 中 的 一 个 较 低 级 的 原 语序 列 而 被 执行 。 例 如 ， 语 各 
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朱 述 了 一 个 高 级 的 动作 ， 它 并 不 与 执行 此 任务 的 特定 机 器 相关 ， 它 也 可 以 由 先前 讨论 过 的 机 器 
指令 序列 来 实现 。 因 此 ， 我 们 的 伪 代 码 结构 

标识 符 二 表达 式 
是 潜在 的 高 级 的 原 语 。 

一 忆 术 的 高 级 原 语 集合 被 标识 出 来 ， 就 可 以 编写 出 一 个 称 作 翻 译 器 (translator) 的 程序 ， 
这 个 程序 能 够 把 用 高 级 原 语 表 示 的 程序 翻译 成 机 器 语言 程序 。 除 了 常常 将 -- 些 机 器 指令 编译 为 
得 序列 来 模拟 一 个 高 级 原 语 所 请 求实 现 的 动作 ,翻译 器 很 类 似 于 第 二 代 语 言 的 汇编 程序 。 因此 ， 
这 种 翻译 程序 通常 也 被 称 为 编译 器 (compiler)。 

番 主 冲 的 一 种 蔡 代 方案 是 解释 器 〈intermpreter)， 它 是 作为 实现 第 三 代 程序 设计 语言 的 另 一 
种 方法 出 现 的。 这 类 程序 类 似 于 翻译 器 ， 不 同 之 处 是 ， 它 们 在 翻译 出 指令 的 同时 执行 指令 ， 而 
个 是 把 它们 记录 下 来 供 将 来 使 用 。 也 就 是 说 ， 解 释 器 不 产生 供 以 后 执行 使 用 的 机 器 语言 程序 ， 
而 实际 上 是 依据 程序 的 高 级 形式 执行 它 。 

尺 一 个 枝 节 问题 是 ， 我 们 应 当 注 意 到 ， 发 展 第 三 代 程 序 设计 语言 的 任务 并 没有 像 我们 想象 
租 那 么 简单 。 使 用 类 似 于 自然 语言 的 形式 来 编写 程序 的 思想 是 革命 性 的 ， 以 至 于 首先 在 许多 管 
理 部 门人 员 中 引起 了 争论 。 第 一 个 编译 器 的 开发 者 Grace Hopper 钊 利 叙述 这 样 的 故事 ， 她 在 演 
不 第 三 代 语言 的 翻 诺 器 时 ， 该 语言 使 用 的 是 德 文 词汇 ， 而 不 是 英文 词汇 。 问 题 是 ， 程 序 设计 语 

264 吾 可 以 围绕 一 小 组 原 语 来 构造 ， 而 这 些 原 语 可 以 用 各 种 各 样 的 自然 语言 来 表达 ， 只 要 稍微 做 些 

修改 就 可 以 交 给 翻译 器 。 但 是 ， 她 惊讶 地 发 现 ， 她 的 听众 对 于 她 在 一 战 以 来 许多 年 中 -一直 在 教 
计算 机 “理解 ”德语 感到 惊讶 。 今 天 ， 我 们 知道 ， 理解 一 个 自然 语言 涉及 的 问题 远 远 超过 对 不 
多 几 条 严格 定义 的 原 语 的 响应 。 的 确 ， 自然 语言 (natural language)〔 例 如 英语 、 德语 和 拉丁 语 ) 
个 同 于 形式 语言 (formal language) (例如 程序 设计 语言 ), 后 者 是 由 语法 严格 定义 的 ( 见 6.4 节 )， 
而 及 痢 还 远 远 没有 涉及 形式 语法 分 析 。 


跨 平台 软件 


典型 的 应 用 程序 必须 依赖 操作 系统 来 完成 它 的 任务 . 它 也 许 需要 窗口 管理 程序 提供 的 服 
务 来 与 计算 机 用 户 进行 交互 ， 或 者 它 需 要 利用 文件 管理 程序 从 海量 存储 器 中 检索 数据 .但 是 ， 
不 同 的 操作 系统 可 能 以 不 同 的 方式 请 求 这 些 服务 。 这 样 一 来 ， 对 于 需要 跨 网 络 和 因特网 传输 
和 扩 行 的 程序 而 言 ， 网 络 和 因特网 涉及 各 种 设计 不 同 的 机 器 和 不 同 的 操作 系统 ， 因 此 该 程序 
必须 要 做 到 与 操作 系统 无 关 ， 同 时 与 机 器 无 关 。“ 跨 平台 ”这 个 术语 用 于 反映 这 种 额外 芍 攻 立 
性 程度 . 也 就 是 说 , 跨 平 台 软 件 是 一 个 可 以 独立 于 操作 系统 设计 和 具体 灿 器 硬件 设计 的 软件 、 
因此 在 整个 网 络 上 它 是 可 执行 的 。 


6.1.2 ”独立 并 超越 机 器 


随 看 第 三 代 语言 的 开发 ， 与 机 器 无 关 的 目标 在 很 大 程度 上 实现 了 。 既 然 第 三 代 语言 中 的 语 
名 不 再 与 某 种 特定 的 机 器 特性 有 关 ， 它 们 就 能 够 在 不 同 的 机 器 上 被 编译 。 通 过 使 用 合适 的 编译 
句 ， 一 个 用 第 三 代 语言 写 的 程序 理论 上 应 该 能 够 在 任何 机 器 上 使 用 。 

生息 ， 现 实 并 不 是 这 样 简单 。 当 一 个 编译 器 设计 出 来 时 ， 目 标 计算 机 的 具体 特征 有 时 候 会 
作为 要 翻译 的 语言 的 条 件 而 反映 出 来 。 例 如 ， 不 同 的 计算 机 处 理 IO 操作 有 不 同方 法 ， 导 致 了 
祖 同 ”的 语言 在 不 同 的 机 器 上 有 着 不 同 的 特性 或 方言 。 因 此 ， 对 于 一 个 程序 而 言 ， 从 一 人 台 机 
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器 移植 到 另 一 台 机 器 上 至 少 要 有 少量 的 修改 ， 这 通常 是 必要 的 。 

伴随 可 移植 性 问题 而 来 的 是 ， 对 在 某 些 情况 下 关于 特定 语言 的 正确 定义 应 该 包括 哪些 东西 
缺乏 一 致 性 的 认识 。 为 此 ， 美 国 国 家 标准 化 学 会 (ANSI) 和 国际 标准 化 组 织 〈ISO) 对 一 些 使 
用 比较 普遍 的 语言 进行 整理 并 公布 了 一 系列 标准 。 对 于 其 他 情况 ， 制 定 非 正 式 标准 是 由 于 某 种 
语言 的 某 个 版 本 的 流行 ， 以 及 其 他 编译 器 的 作者 实现 一 个 兼容 的 产品 的 意愿 。 但 是 ， 即 使 是 高 
度 标准 化 了 的 语言 ， 编 译 器 的 设计 者 通常 还 是 会 提供 一 些 不 包括 在 标准 版 本 之 中 的 特性 ， 这 有 
时 也 被 称 为 语言 书展 。 如 果 一 个 程序 员 利 用 这 些 特性 ， 他 所 设计 的 程序 将 不 再 与 采用 其 他 厂商 
的 编 详 器 的 环境 兼容 。 

在 程序 设计 语言 的 整个 历史 中 ， 由 于 以 下 两 个 原因 ， 第 三 代 语 言 没 有 真正 达到 与 机 器 无 关 
性 这 个 事实 。 第 一 ， 它 们 已 经 几乎 达到 了 机 器 无 关 性 ， 这 样 ， 软 件 就 可 以 从 一 台 机 器 相对 比较 
容易 地 移植 到 另 一 台 机 器 。 第 二 ， 与 机 器 无 关 性 的 最 终 目 的 仅仅 是 其 他 更 高 要 求 的 一 个 基础 。 
确实 ， 计 算 机 能 够 反应 像 


把 Price + Shipp ingcharge 的 值 赋 给 Totalcost 


这 梓 的 高 级 语句 ， 这 种 现实 致使 计算 机 科学 家 们 焚 想 实现 一 个 程序 设计 环境 ， 它 能 允许 人 们 用 
抽象 的 概念 与 机 器 进行 交互 ， 而 不 再 强迫 机 器 把 这 些 概念 翻译 成 与 机 器 兼容 的 格式 。 此 外 ， 计 
算 机 科学 家 更 希望 机 器 能 够 实现 许多 算法 发 现 过 程 ， 而 不 是 仅仅 能 够 执行 算法 。 结 果 带 来 程序 
设计 语言 谱系 的 不 断 扩 大 ， 以 至 于 按照 不 同 世 代 的 清晰 划分 受到 挑战 。 


6.1.3 程序 设计 范 型 


将 程序 设计 语言 划分 为 不 同 代 ， 是 基于 一 个 线性 尺度 的 〈 见 图 6-1)， 对 于 一 个 语言 的 定 
位 ， 则 是 由 这 个 语言 的 使 用 者 不 受 机 器 世界 语言 约束 的 程度 ， 以 及 允许 从 问题 的 角度 来 考虑 
的 程度 决定 的 。 实 际 上 ,程序 设计 语言 的 发 展 并 不 确切 地 遵循 这 种 方式 ， 而 是 沿 着 不 同 的 可 
以 选择 的 程序 设计 过 程 〈 称 为 程序 设计 范 型 (programming paradigm)) 发 展 。 于 是 ， 图 6-2 
所 示 的 多 路 径 图 能 更 好 地 描述 程序 设计 语言 的 发 展 历程 , 该 图 显示 了 来 源 于 不 同 范 型 的 不 同 
路 径 的 出 现 和 发 展 。 具 体 地 说 ， 这 幅 图 展示 了 4 条 路 径 ， 分 别 代表 了 函数 式 范 型 、 面 向 对 象 
型 范 型 、 命 令 型 范 型 和 说 明 性 范 型 ， 在 图 中 ， 通 过 与 其 他 语言 的 相对 位 置 关 系 ， 指 出 了 与 基 
一 个 范 型 联系 的 各 种 语言 的 放生 时 间 。( 但 是 这 并 不 暗示 一 种 语言 必然 是 从 一 种 早期 语言 中 
发 展 而 来 的 。) 

我 们 应 当 注意 到 ， 尽 管 在 图 6-2 中 标识 的 范 型 称 为 程序 设计 范 型 ， 然 而 对 不 同 的 分 支 〈( 即 
路 线 ) 的 选择 已 经 超出 了 程序 设计 过 程 的 范畴 。 它 们 基本 上 代表 了 构建 问题 解决 方案 的 不 同方 
法 ， 并 且 因 此 影响 整个 软件 开发 过 程 。 在 这 种 意义 上 ， 程 序 设计 范 型 这 个 词 有 些 使 用 不 当 ， 一 
个 更 现实 的 术语 应 该 是 软件 开发 范 型 。 


问题 在 人 符合 计算 机 问题 在 计算 机 符合 人 的 
特征 的 环境 里 被 解决 特征 的 环境 里 被 解决 
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图 6-1 程序 设计 语言 的 发 展 
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图 6-2 程序 设计 范 型 的 演变 


辣 令 型 范 型 (imperative paradigm)， 也 叫 过 程 范 型 (procedural paradigm)， 它 代表 了 程序 设 
计 过 程 的 传统 方法 。 命 令 型 范 型 就 是 第 5 章 中 的 伪 代 码 以 及 第 2 章 讨 论 的 机 器 语言 所 基于 的 范 
型 。 正 如 它 的 名 字 所 暗示 的 那样 ， 命令 型 范 型 定义 程序 设计 过 程 是 开发 一 个 命令 序列 ， 遵照 这 
个 序列 ， 对 数据 进行 操作 以 产生 所 期 望 的 结果 。 内 此 命令 型 范 型 告诉 我 们 要 通过 寻找 解决 问题 
的 算法 来 处 理 程序 设计 过 程 ， 并 且 要 将 这 个 算法 表示 为 命令 的 序列 。 

与 命令 型 范 型 相对 的 是 说 明 性 范 型 〈declarative paradigm)， 它 要 求 程序 员 描 述 要 解决 的 问 
题 ， 而 不 是 解决 该 问题 的 算法 。 更 准确 地 说 ， 一 个 说 明 性 程序 设计 系统 应 用 一 个 预先 设 定 的 通 
用 的 解决 问题 的 算法 来 解决 面临 的 问题 在 这 种 环境 中 ， 程序 员 的 工作 变 成 了 开发 问题 的 准确 
陈述 ， 而 不 是 描述 一 个 解决 问题 的 算法 。 

在 开发 基于 说 明 性 范 型 的 程序 设计 环境 时 ， 一 个 主要 的 障碍 就 是 需要 一 个 潜在 的 解决 问题 
的 算法 。 正 因为 这 样 ， 于 期 的 说 明 性 语言 试图 用 于 某 些 特定 的 用 途 ， 并 满足 某 些 特殊 的 应 用 。 
例如 ， 许 多 年 以 来 ， 说 明 性 方法 已 经 用 于 模拟 一 个 系统 〈 经 济 的 、 物理 的 、 政 治 的 等 ) 来 判定 
假设 或 获得 。 在 这 样 的 环境 中 ， 潜在 的 算法 本 质 上 是 通过 重复 计算 参数 的 俏 (国内 生产 总 值 、 
贸易 赤字 等 ) 来 模拟 时 间 推 移 的 过 程 ， 其 中 所 用 的 参数 都 基于 以 前 计算 得 到 的 值 。 于 是 ， 用 于 
这 类 模拟 的 说 明 性 语言 需要 首先 实现 一 个 执行 该 命令 型 过 程 的 算法 . 然后 ， 使 用 这 个 系统 的 程 
序 员 唯 一 要 做 的 任务 就 是 描述 要 模拟 的 情况 。 按照 这 种 方法 ， 天 气 预 报 员 不 必 开 发 一 个 预报 天 
气 的 算法 ， 只 需要 描述 当天 的 天 气 情况 ， 让 潜在 的 模拟 算法 来 产生 未 来 儿 天 的 天 气 预报 。 

人 们 发 现 ， 数学 里 的 形式 逻辑 学 科 提供 了 一 种 简单 的 、 适用 于 通用 的 说 明 性 程序 设计 系统 
的 问题 求解 算法 ， 这 极 大 地 促进 了 说 明 性 范 型 的 发 展 。 其 结果 是 人 们 对 于 说 明 性 范 型 和 逻辑 程 
序 设计 《logic programming) 的 出 现 更 加 关注 了 ， 这 将 在 67 节 中 进一步 讨论 。 

另 一 种 程序 设计 范 型 是 函数 式 范 型 (functional paradigm )， 基于 该 范 型 的 程序 可 以 看 作 是 接 
受 输入 和 产生 输出 的 实体 。 数学 家 将 这 样 的 实体 称 为 函数 ， 这 就 是 这 种 范 型 被 称 为 函数 式 范 型 
的 原因 。 函数 式 范 型 的 程序 由 相 联系 的 预先 定义 的 小 的 程序 单元 (预定 义 的 函数 ) 组 成 ， 其 中 
每 一 个 程序 单元 的 输出 可 以 用 来 作为 另 一 个 程序 单元 的 输入 ， 通过 这 种 方式 可 以 获得 所 期 望 的 
整体 上 的 输入 -输出 关系 。 简 而 言 之 ， 这 种 函数 式 范 型 的 程序 设计 过 程 就 是 把 函数 构造 成 简单 函 
数 的 艇 套 联 合体 。 

举 一 个 例子 ， 图 6-3 说 明了 支票 德 余额 的 函数 可 以 如 何 由 两 个 较 简单 的 函数 构成 其 中 一 
个 称 为 Fina_sum， 它 接收 一 些 值 作为 它 的 输入 ， 产生 这 些 值 的 和 作为 它 的 输出 。 另 一 个 称 为 
Fina_ diff， 它 接收 两 个 值 ， 计 算 它们 的 差 。 使 用 LISP 程序 设计 语言 〈 一 个 著名 的 函数 式 程序 
设计 语言 ) 时 ， 图 6-3 所 示 的 结构 可 以 用 下 列表 达 式 表示 ; 


面 疝 对 象 范 型 


| 
| 
| 
| 
| 
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(Fina_ aifft (Fina_sum DOLQ_balance Creaditsl (Fina _ sum Debitsy 1) 


表达 式 的 这 个 媒 套 结构 《〈 如 图 括号 中 指定 的 ) 反映 了 这 样 一 个 事实 ， 即 函数 Fina_qifft 的 输 [268] 
人 是 由 Fina_sunm 的 两 次 应 用 产生 的 。 了 并 DOQ_Ssum 的 第 一 个 应 用 的 绪 果 是 所 有 的 Credaits 加 到 
01d_balance 上 ; Find_sum 的 第 二 个 应 用 就 是 计算 所 有 的 pebits。 然 后 ， 函 数 Finad_dift 

使 用 这 两 个 结果 以 得 到 新 的 支票 余额 。 


输入 :DODld_ balance Credits Debhits 


和 


Fnd Surmn Find Sr 


ee 


Find_ 看 任 


| 


输出 ， New balance 


图 6-3 ”由 较 简 单 的 函数 构造 支票 短 平 衡 函 数 


为 了 更 全 面 理 解 函数 式 范 型 与 命令 型 范 型 之 间 的 区 别 ， 我 们 把 求 支票 短 余 额 的 函数 式 程序 
间 下 面 遭 特命 令 型 范 型 的 伪 代 码 程序 进行 一 下 比较 : 


TetaJ_cLrealtSs<e Sum Of 己 11 CreaditSs 
TemP_balance<Dl1aQ_balance + Total_creaitg 


TotalL_aeblts<eSurm Of 忌 ]1 Debltse 
有 站 Lamce<ATemp_ balanmnce -Total_Qebits 


注意 ， 这 个 命令 型 程序 由 多 条 语句 组 成 ， 每 条 语句 都 要 求 执行 计算 ， 并 把 这 个 结果 存储 起 来 供 

以 后 使 用 。 与 命令 型 程序 不 同 ， 孙 数 式 程序 由 单个 语句 组 成 ， 程 序 中 的 每 个 计算 结果 都 会 立即 
传送 到 下 一 个 函数 式 程 序 ， 从 某 种 意义 上 说 ， 命 令 型 程序 可 以 看 作 是 若干 工厂 的 集合 ， 每 个 工 

三 把 原材料 生产 成 产品 ， 并 把 这 些 产 品 存 放 在 仓库 里 。 然 后 ， 产 品 从 这 些 仓库 被 装运 到 其 他 需 

要 这 些 产品 的 工厂 。 而 函数 式 程序 可 以 类 似 于 许多 工厂 的 集合 ， 在 这 个 工厂 的 集合 里 ， 各 个 工 [269 
三 协调 一 致 ， 每 个 工厂 仅仅 生产 其 他 工厂 订购 的 产品 ， 然 后 立刻 把 这 些 产 品 运送 到 目的 地 而 不 
需要 中 间 人 仓库。 这 种 效率 也 是 函数 式 范 型 的 支持 者 声明 的 优点 之 一 。 

还 有 改 一 种 程序 设计 范 型 〈 当 今 的 软件 开发 领域 中 最 著名 的 一 个 ) 是 面向 对 象 范 型 
(objectoriented paradigm)， 它 是 与 称 为 面向 对 象 程序 设计 (object-oriented programming，OOP) 
的 程序 设计 过 程 相 联系 的 。 遵 照 该 范 型 ， 一 个 软件 系统 被 看 作 是 对 象 (object) 的 集合 ， 每 一 个 
对 象 都 能 够 执行 与 自己 相关 的 以 及 其 他 的 对 象 请 求 的 动作 。 总 之 ， 这 些 对 象 之 间 的 交互 可 以 很 
方便 地 解决 问题 。 

青 举 一 个 面向 对 象 方 法 的 例子 ， 考 虑 一 个 开发 图 形 用 户 界面 的 工作 。 在 面向 对 象 环 境 中 ， 
屏幕 上 的 图 标 将 作为 对 象 来 实现 。 每 个 对 象 包含 了 一 组 过 程 〈 在 面向 对 象 环 境 中 称 为 方法 
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(method))， 这 些 过 程 描述 了 对 象 是 如 何 响应 各 种 事件 的 发 生 的 ， 诸 如 被 鼠标 点 击 选中 或 者 是 
饭 鼠 标 在 屏幕 上 拖 动 等 。 因 此 ， 整 个 系统 是 对 象 的 集合 ， 每 一 个 对 象 都 知道 如 何 响应 与 之 有 关 
的 事件 。 
为 了 比较 命令 型 范 型 与 面向 对 象 范 型 ， 这 里 考虑 一 个 涉及 名 字 列表 的 程序 。 在 传统 的 命令 
虹 范 型 中 ， 这 个 列表 仅仅 被 看 为 一 个 数据 的 集合 。 任 何 一 个 访问 这 个 列表 的 程序 必须 包括 执行 
所 需 操作 的 算法 。 而 在 面向 对 象 方法 中 ， 这 个 列表 将 被 构建 成 列表 和 操作 这 个 列表 的 方法 的 集 
合 〈 对 这 个 列表 的 操作 可 能 包括 插入 、 删 除 表 项 、 判 断 表 是 否 为 空 ， 以 及 为 列表 排序 等 过 程 ) 
妨 外 一 个 需要 操作 这 个 列表 的 程序 单元 不 再 包含 执行 这 些 任务 的 算法 ， 而 是 要 利用 对 象 中 提供 
的 过 程 。 从 某 种 意义 上 说 ， 程 序 要 求 列表 自己 把 自己 排 好 序 ， 而 不 是 像 在 命令 型 范 型 中 那样 对 
列表 排序 。 

们 知 我 们 将 要 在 6.5 节 更 详细 地 讨论 面向 对 象 范 型 ， 但 面向 对 象 范 型 在 当今 软件 开发 领域 的 
旦 要 仁 要 求 我 们 在 这 里 引入 类 的 概念 。 回 忆 可 知 ， 一 个 类 可 以 包含 数据 (如 名 字 列表 )， 同 时 旬 
全 完成 操作 的 方法 的 集合 (如 在 列表 中 插入 新 的 名 字 )。 这 些 特征 必须 通过 所 写 的 程序 中 的 语句 
来 描述 。 对 象 的 属性 的 这 一 描述 被 称 为 类 (class )。 一 且 关 被 构造 好 了 ， 它 就 可 以 在 任何 具有 这 
芋 特 性 的 对 象 需要 的 时 候 被 使 用 。 几 个 对 象 可 以 基于 同一 个 类 。 像 同 卵 双 胞 胎 -- 样 ， 由 于 这 些 
对 和 象 产生 于 相同 的 模板 〈 相 同 的 类 )， 它们 具有 相同 特征 的 同时 又 有 明显 的 区 别 。 因 此 , :一旦 一 
个 关 构 建 好 以 后 ， 在 任何 需要 包含 该 类 的 特征 的 对 象 的 时 候 都 可 以 重用 。( 基 于 特定 的 类 构建 的 
对 象 称 为 这 个 类 的 实例 〈instance)。) 

由 于 对 象 是 明确 定义 的 单元 ， 在 可 重用 的 类 中 ， 其 描述 是 珀 立 的 ， 所 以 面向 对 象 范 型 受到 了 欢 
地 。 进 而 ， 面 向 对 象 程序 设计 的 支持 者 指出 面向 对 象 范 型 为 软件 开发 的 “构件 块 ”方法 提供 了 一 个 
很 日 然 的 环境 。 他 们 设想 了 预定 义 的 类 的 软件 库 ， 通 过 这 个 库 ， 新 的 软件 系统 能 够 像 许 多 传统 的 产 
品 构 建 于 现成 的 组 件 一 样 构建 出 来 。 这 样 的 库 已 经 构建 起 来 了 ， 我 们 将 在 第 7 章 学 习 到 、. 

二 后 ， 我 们 应 该 注意 到 ， 包 含 在 一 个 对 象 内 的 方法 实质 上 是 一 些小 的 命令 型 程序 单元 这 
中 意味 者 ， 大 多 数 基于 面向 对 象 范 型 的 程序 设计 语言 都 包含 许多 可 以 在 命令 型 语言 中 找到 的 特 
性 。 例 如 ， 当 前 比较 流行 的 面向 对 象 语言 C++ 就 是 通过 在 C 语言 这 个 命令 型 语言 中 添加 了 一些 
面 站 对 象 的 特性 开发 出 来 的 。 此 外 ， 从 C++ 派生 出 来 的 Java 和 C# 也 都 继承 了 命令 型 语言 的 精 
盟 。 在 6.2 节 和 6.3 节 ， 我 们 将 探究 命令 型 语言 的 许多 特性 ， 在 这 样 做 的 同时 ， 我 们 将 讨论 贯穿 
企 绝 六 多 数 面向 对 象 软件 里 的 概念 。 然 后 ， 在 6.5 节 中 ， 我 们 将 学 习 面向 对 象 范 型 专 有 的 特性 ， 


问题 与 练习 

|. 全 但 么 意义 上 说 用 第 三 代 语 言 编写 的 程序 是 与 机 器 无 关 的 ? 从 什么 意义 下 说 它们 膛 是 依赖 于 机 
器 的 ? 

2. 汇编 器 和 编译 器 的 区 别 是 什么 ? 

3 我 们 可 以 用 下 面 的 话 概述 命令 型 程序 设计 范 型 它 强调 的 是 描述 一 个 可 以 方便 解决 问题 的 过 程 。 请 人 
出 询 明 性 范 型 、 国 数 式 范 型 和 面向 对 象 范 型 的 类 似 概述 。 

4. 在 什么 意义 上 ， 第 主 代 程序 设计 语 言 比 早 期 的 程序 设计 语言 更 高 级 ? 


下 本 节 中 ， 我 们 将 研究 命令 型 程序 设计 语言 和 面向 对 象 程序 设计 语言 中 的 一 些 概念 。 我 人 
将 会 从 Ada、C、C++、C#、 TORIRAN 和 Java 等 程序 设计 语言 中 引出 一 些 例子 。 C 是 第 三 代 命令 
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型 语言 ，C++ 是 通过 对 C 语 言 进行 扩展 而 得 到 的 面向 对 象 的 程序 设计 语言 ，Java 和 C# 均 继承 了 
C++ 的 一 些 特 性 , 它们 都 是 面向 对 象 语言 (Java 是 SUN 公 司 开 发 的 , 而 C# 是 由 微软 公司 开发 的 。) 
FORTRAN 和 Ada 最 初 是 作为 第 三 代 命令 型 语言 设计 的 ， 尽 管 它 的 最 新 版 本 包含 了 大 多 数 的 面向 
对 象 范 型 。 附 录 D 简 短 地 介绍 了 这 些 语 言 中 每 一 种 的 背景 。 

尽管 我 们 在 例子 中 涉及 了 诸如 C++、Java、C# 之 类 的 面向 对 象 语言 ， 但 是 在 本 节 中 ， 我 们 
的 程序 在 形式 上 似乎 还 是 属于 命令 型 范 型 ， 这 是 因为 面向 对 象 程序 中 的 许多 单元 〈 描 述 一 个 对 
象 是 怎样 响应 外 部 激励 的 过 程 等 ) 基本 上 都 是 简短 的 命令 型 语言 程序 。 在 6.5$ 节 ， 我 们 将 主要 讨 
论 面向 对 象 范 型 的 独 有 特性 。 

通常 ， 程 序 由 一 组 语 名 组成， 这些 语 名 一 般 可 以 分 成 3 类 : 声明 语句 、 命 令 语 名 和 注释 。 声 
明 语 句 〈declarative statement) 定义 了 在 程序 中 使 用 的 需要 自 定义 的 术语 ; 命令 语句 (imperative 
statement) 描述 了 潜在 的 算法 里 的 步骤 ， 而 注释 (comment) 则 通过 比较 人 性 化 的 形式 来 解释 程 
序 中 的 一 些 复杂 特性 ， 从 而 提高 了 程序 的 可 读 性 。 通 常 ， 命 令 语言 的 程序 〈 或 者 诸如 过 程 -一样 的 命 [272 
令 型 语言 程序 单元 ) 以 描述 程序 所 操作 的 数据 的 一 组 声明 语句 开始 ;， 紧 接 其 后 的 是 描述 被 执行 的 算 
法 的 命令 语句 〈 图 6-4)。 注 释 语句 是 很 分 散 的， 仅仅 出 现在 需要 对 程序 进行 解释 的 地 方 。 

根据 指引 ， 我 们 通过 语句 目录 来 进行 编程 概念 的 研究 ， 该 语句 目录 的 顺序 是 我 们 在 一 个 程 
序 中 可 能 遇 到 的 这 些 语 句 的 顺序 ， re 


一 部 分 由 声明 语句 组 成 ， 
se 


第 二 部 分 由 命令 语句 组 成 ， 
描述 该 程序 所 要 实现 的 动作 
图 6-4 一 个 典型 的 命令 型 程序 或 程序 单元 的 结构 


脚本 语言 

一 部 分 命令 编程 语言 是 称 为 脚本 语言 ( scripting language ) 的 语言 集合 .这些 语 言 通常 用 
来 执行 管理 的 任务 ， 而 不 是 开发 复杂 的 程序 . 这 种 任务 的 表述 被 称 为 脚本 (script)， 它 解释 
了 本 语 “脚本 语言 。” 例 如， 计算 机 系统 的 管理 员 也 许 会 写 一 个 脚本 来 描 进 二 系列 每 晚 执行 的 
需要 保持 记录 的 活动 ,或 者 PC 的 用 户 也 许 会 写 一 个 脚本 来 指导 一 系列 所 需 程序 的 执行 ， 以 从 
数码 相机 中 读 取 有 照片， 通过 日 期 检索 照片 ， 以 及 在 档案 存储 系统 中 存储 照片 的 副本 。… 脚 未 语 
言 的 起 源 可 以 追溯 到 20 世 纪 60 年 代 的 工作 控制 语言 ， 当 时 在 批 处 理工 作 的 进度 中 它 被 用 于 指 
导 操 作 系 统 (参看 3.1 小 节 )。 甚 至 在 今天 ， 许 多 人 都 认为 脚本 语言 是 指导 其 他 语言 执行 的 语 
言 ， 这 就 对 现在 的 脚本 语言 的 认识 产生 了 局 限 性 。 脚本 语言 的 例子 包括 Per1 和 PHP， 三 者 在 
控制 服务 器 Web 应 用 和 VBScript 中 都 很 常见 (和 套 看 4.3 小 节 )，VBScript 是 Visual Basic 的 非 标准 
语言 ， 它 是 由 微软 开发 的 并 用 于 Windows 的 特定 环境 下 。 


6.2.1 ”变量 和 数据 类 型 


正如 在 6.1 节 中 提 到 的 那样 ， 高 级 程序 设计 语言 允许 使 用 描述 性 的 名 字 指 代 存 储 器 地 址 ， 
而 不 必 再 使 用 数字 地 址 ， 这 样 的 名 字 称 为 变量 〈variable)。 之 所 以 这 样 取 名 是 因为 ， 随 着 程序 
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的 执行 ， 只 要 改变 了 存放 在 这 个 存储 单元 里 的 值 ， 那么 与 该 名 字 相 联系 的 值 就 改变 了 。 在 程序 
使 用 这 个 变量 之 前 ， 我 们 的 示例 语言 要 求 必须 通过 一 个 声明 语句 来 建立 变量 。 同 时 ， 声明 语 名 
也 会 要 求 程序 员 描 述 变量 所 指 代 的 存储 器 地 址 中 的 数据 的 类 型 ， 

这 样 的 类 型 称 为 数据 类 型 (data type )， 它 决 定 了 数据 的 编码 方式 以 及 在 该 数据 上 可 执行 的 
操作 。 例 如 ， 整 型 就 是 以 二 进 制 补 码 形式 存储 的 数值 型 数据 ， 它 是 由 全 体 整 数组 成 的 。 可 以 在 
束 型 数据 上 进行 的 操作 包括 传统 的 算术 运算 和 比较 运算 ， 如 判断 一 个 数 是 否 比 另 一 个 数 大 。 实 
型 (real)《〈《 有 时 也 称 为 浮 点 型 (float)) 征 指 以 浮 点 形式 存储 的 数值 型 数据 。 可 以 在 实 型 数 上 进 
行 的 操作 很 类 似 于 那些 可 以 在 整 型 数 上 进行 的 操作 ， 但 是 注意 ， 把 两 个 实 型 数 相 加 与 把 两 个 束 
型 数 相 加 是 两 个 不 一 样 的 操作 。 

假设 我 们 需要 在 一 个 程序 中 使 用 变量 weightrimit 来 指 代 主 存 是 以 二 进 制 补 码 形式 编码 的 
数据 值 的 地 址 。 在 程序 设计 语言 C、C++、Java 和 c# 中 ， 我 们 可 以 在 程序 的 头 部 插入 声明 语 名 

1 了 风 el 导 htDiIrmit ; 

这 个 语句 的 意思 是 : “名 字 WeightLimit 将 要 在 后 面 的 程序 中 用 到 ， 它 指 代 一 个 以 二 进 制 补 码 
记 数 法 表示 的 存放 在 存储 器 某 个 区 域 的 值 。” 问 一 类 型 的 多 个 变量 通常 在 同一 个 声明 语句 中 声 
明 。 例 如 ， 语 名 


Int Height，WiatDn; 


声明 了 两 个 整 型 变量 Height 和 wiath。 此 外 ， 大 多 数 语言 允许 在 变量 声明 时 ， 为 变量 赋 一 个 初 
始 值 。 因 此 ， 语 名 

In WeightLimit = 100， 
个 仅 声 明了 一 个 整 型 变量 weightLimit， 和 而且 膛 为 这 个 变量 赋 了 一 个 初始 值 100。 

有 其 他 通用 数据 类 型 还 包括 字符 型 和 布尔 型 。 字符 型 〈character) 指 的 是 指 由 符号 组 成 的 数 
所 ， 它 们 通常 使 用 ASCI 码 或 者 Unicode 字符 集 进行 编码 存储 。 可 以 在 这 种 数据 上 进行 的 操作 
包括 比较 运算 ， 如 按照 字母 顺序 判断 一 个 字符 是 否 在 另 一 个 字符 的 前 面 ， 判断 一 个 字符 串 是 理 
是 另 一 个 字符 的 子 串 ， 僚 及 将 一 个 字符 串 连 接 在 另 一 个 字符 串 的 尾部 从 而 形成 一 个 更 长 的 学 符 
串 等 。 语 各 

char Letter，Digit， 
企 程 序 设计 语言 C、C++、C# 和 Java 中 用 来 声明 两 个 字符 型 恋 是 ， Letter 和 Digit。 

布尔 型 (Boolean ) 征 仅 仅 有 真 和 假 两 个 值 的 数据 类 型 。 可 以 和 在 布尔 型 上 进行 的 操作 是 判断 
当前 的 值 是 真 还 是 假 。 例 如 ， 如 果 变 量 Enaoflist 锌 声明 为 一 个 布尔 型 变量 ， 那 么 下 面 这 种 
形 汉 的 语句 ， 

1 寺 《Limit Exceeded) then (...) else( . 
是 很 合理 的 。 

作为 原 语 包括 在 程序 设计 语言 里 的 数据 类 型 一 一 像 对 于 整 型 的 int, 对 于 字符 的 char 
称 为 基本 数据 类 型 (primitive data type)。 我 们 所 知 的 整 型 、 实 型 / 浮 点 型 、 字符 型 、 布 尔 型 是 通 
用 的 原 语 ; 其 他 数据 类 型 (包括 图 像 、 音 频 、 视频 以 及 超 文 本 ) 日前 还 没有 成 为 程序 设计 语言 
的 通用 原 语 。 但 是 ， 像 GIF、JPEG 和 HTMIL 这 样 的 类 型 马上 就 要 像 整 型 和 实 型 一 样 通用 。 在 
6.5 节 和 8.4 节 ， 我 们 将 学 习 到 面 站 对 象 范 型 如 何 使 程序 员 和 相 一 门 编程 语 言 提 供 的 原始 的 数据 类 
型 的 基础 之 上 扩展 可 用 的 数据 类 型 的 功能 。 的 确 ， 这 种 能 力也 是 面向 对 象 范 型 被 称赞 的 特性 。 

下 面 程序 段 是 用 C 语 言及 其 派生 语言 C++\C# 和 Java 表 达 的 声明 语句 。 变 量 Dength 和 Wiath 
户 明 为 实 型 / 浮 点 型 ， 变 量 Price、max 和 Total 声明 为 整 型 ， 变 量 symbol 声明 为 字符 型 。 
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f] at Length， 人 IaQtD; 
1 mt 下 工人 ， 下 志 式 ， 开口 七 已 上 ; 
char Symbol 


在 6.4 节 ， 我 们 会 看 到 翻译 器 是 如 何 利用 从 这 些 说 明 语 句 中 收集 到 的 知识 把 一 个 程序 从 高 
级 语言 形式 翻译 为 机 器 语言 形式 。 这 里 ， 我 们 要 注意 ， 这 些 信 息 可 以 用 来 识别 错误 。 例 如 ， 对 
于 两 个 早先 声明 为 布尔 类 型 的 变量 ， 如 果 翻 译 器 查找 到 一 个 要 求 对 它们 做 加 法 的 语句 ， 那 它 应 
该 考虑 到 这 个 语句 多 半 是 错误 的 ， 并 把 这 个 结果 报告 给 用 户 。 


6.2.2 ”数据 结构 


除了 数据 类 型 ， 程 序 中 的 变量 通常 与 数据 结构 (data structure) 相 联系 ， 即 数据 在 概念 上 的 
形态 与 布局 相 联系 。 例 如 ， 文 本 通常 被 看 作 是 一 个 长 的 字符 串 ， 而 销售 记录 可 能 被 看 为 数字 值 
的 矩形 表 ， 其 每 一 行 代 表 了 某 个 销售 人 员 完 成 的 销售 ， 而 每 一 列 代表 了 某 一 天 所 完成 的 销售 。 

一 个 常用 的 数据 结构 是 同 构 数 组 〈(homogeneous array)， 即 一 块 相 同类 型 的 值 ， 如 一 维 表 、 
一 个 由 行 和 列 组 成 的 二 维 表 或 更 高 维 数 的 表 这 样 的 形式 。 为 了 在 程序 中 建立 这 样 的 表 ， 大 多 数 
的 程序 设计 语言 要 求 声 明 语句 在 声明 数组 名 字 的 同时 也 要 明确 指出 数组 每 一 维 的 长 度 。 例 如 ， 
图 6-5 显示 了 由 C 语言 语句 

int Scores[2][9] ; 
声明 的 概念 上 的 结构 ， 它 的 意思 是 变量 scores 将 要 在 后 面 的 程序 中 使 用 到 ， 并 且 是 一 个 有 2 行 
和 9 列 的 二 维 的 整 型 数组 。 而 在 FORTRAN 中 同样 的 声明 语句 要 写成 


TNTEGER SCOTeS (2 9) 


一 旦 声明 了 一 个 同 构 数 组 ， 它 就 能 够 通过 它 的 名 字 而 在 程序 中 的 任何 地 方 引 用 它 ， 或 者 可 以 通 
过 一 个 称 作 下 标 (index) 的 整数 值 来 标识 这 些 数组 的 组 成 元 素 ， 下 标明 确 了 行 、 列 等 所 需 的 信 
息 。 但 是 ， 下 标的 范围 在 不 同 的 语言 中 是 不 同 的 。 例 如 ， 在 C、C++、Java 和 C# 语 言 中 ， 下 标 从 
0 开始 ， 也 就 是 说 对 scores 数 组 〔( 上 文 已 定义 ) 的 第 2 行 第 4 列 的 访问 应 该 是 Scores [1]1 [3]， 
而 访问 第 1 行 第 1 列 应 该 是 scores [0] [0] 。 相 反 ， 在 FORTRAN 程 序 中 下 标 是 从 1 开始 的 ， 所 以 
访问 第 2 行 第 4 列 是 scores[21] [4] 〈 可 再 参考 图 6-$)。 


息 己 局 工 总 乌 





在 FORTRAN 中 写作 在 C 语 言 中 写作 Scores 
Scores(2，4)1， 下 [11[3]1， 下 标 从 0 开始 
标 从 1 开始 


图 6-5 ” 押 有 2 行 9 列 的 二 维 数组 


相 比 由 同一 种 数据 类 型 的 数据 元 素 组 成 的 同 构 数 组 ， 异 构 数 组 〈heterogeneous array) 是 这 
样 一 个 其 元 素 具 有 不 同 的 类 型 的 数据 块 .例如 , 一 个 雇员 的 数据 块 也 许 包 括 一 个 字符 型 的 Name、 
一 个 整 型 的 age 以 及 一 个 实 型 的 SkillRating。 这 样 的 数组 用 C 语言 声明 如 下 : 


号 七 工 由 忆 七 半 安 世尊 工 Name[25]:; 
了 天 芷 入 可 马 ; 
上 荆 口 a 蕊 SK11 1] RatIDmGS， } 


EmP DYee ; 
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上 述 声明 意思 是 : 变量 Bmployee 是 指向 一 个 结构 体 ， 这 个 结构 体 有 3 个 构成 元 素 : Name( 包 
合 25 个 字符 的 字符 串 )、age 和 SkillRating《〔 见 图 66)， 一 有 旦 声明 了 一 个 这 样 的 数组 ， 程 序 开 
发 人 员 就 可 以 使 用 这 个 数组 的 名 字 (Emplovee) 来 指向 整个 数组 ， 或 者 可 以 用 数组 的 名 字 跟 一 

个 圆 点 和 构成 元 素 的 名 字 来 表示 数组 中 的 单个 元 素 (如 Emplovee .age) 。 


Meredith W Linsmeyer 
se 


mpPp]】 Ye 己 过 本 ~ 
民 mD] 辣 Y 电 已 .中 呵 已 


6.2 
ployee.skillRatino 
冬 6-6 异 构 数组 Employee 的 概念 结构 


在 第 8 章 ， 我 们 将 会 看 到 诸如 数组 这 样 的 在 概念 结构 是 如 何在 计算 机 内 部 真正 实现 的 ， 怕 
怨 是 ， 我 们 将 会 学 到 ， 一 个 数组 里 面 的 数据 可 以 散布 在 主 存储 器 或 海量 存储 器 上 的 广大 区 域内 ， 
之 衣 是 我 们 将 数据 结构 表达 成 概念 上 的 数据 形态 或 者 布局 的 原因 。 当 然 ， 计 算 机 存储 系统 中 的 实 
际 布局 也 许 与 概念 上 的 布局 会 有 很 大 的 不 同 ， 


6.2.3 利 量 和 字面 量 ， 


有 时 ,在 程序 中 要 用 到 预先 确定 的 固定 值 。 例如 ， 一 个 管理 机 场 附近 区 域 室 中 交通 的 程序 ， 
也 许 要 许多 次 引用 一 些 关于 机 场 的 海拔 高 度 的 数据 。 当 编 写 这 样 一 个 程序 的 时 候 ， 在 每 次 需要 
这 个 数据 时 ， 我 们 都 需要 以 数字 的 形式 将 其 引入 一 一 645 m。 一 个 值 的 这 样 一 种 显 式 出 现 称 为 字 
面 量 〈iiteral)。 字 面 量 的 使 用 导致 了 诸如 


下 寺 ectdlVvea]lt < 及 Itimeter + 645 
这 样 的 程序 语句 的 出 现 ， 其 中 Bffectivealt 和 Altimeter 是 假定 的 变量 ， 而 645 是 一 个 字面 
量 。 这 样 ， 赋 给 变量 Altimeter 的 值 加 上 645 的 结果 赋 给 了 变量 Effectivealt 

在 大 多 数 程序 设计 语言 中 ， 由 文字 组 成 的 字面 量 用 引用 标记 来 表述 ， 用 来 与 其 他 程序 部 分 
相 区 分 。 例 如 ， 语 名 


工 二 StName “二 "Smithnw 


可 以 用 来 把 文字 “Smith ”分 配给 变量 LastName ， 而 语句 


LaSstName -一 Smith 


则 是 把 变量 smith 的 值 赋 给 恋 量 LastName 
通常 ， 使 用 字面 量 不 是 一 个 好 的 编程 习惯 ， 因为 字面 量 掩盖 了 包含 字面 量 的 语句 的 真实 意 
艾 。 例 如 ， 当 一 个 读者 读 到 


ELttectivealt -一 ALLimeter } 445 


这 个 语句 的 时 候 ， 他 如 何 知 道 这 个 645 代 表 的 是 什么 呢 ? 此 外 , 字面 量 的 使 用 使 修改 程序 的 工作 
变 得 复杂 ， 而 修改 程序 是 必然 的 过 程 。 如 果 将 我 们 的 空中 管制 程序 移植 到 另 一 个 机 场 ， 那 么 所 
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有 的 对 机 场 的 海拔 高 度 的 引用 都 将 要 修改 。 如 果 每 一 处 对 海拔 高 度 的 引用 都 使 用 了 字面 量 645， 
那么 在 整个 程序 中 每 一 个 这 样 的 引用 都 要 被 找到 并 且 加 以 修改 。 再 假设 ， 如 果 在 数量 上 ， 而 不 
仅仅 是 在 海拔 高 度 上 ， 同 时 也 使 用 了 这 个 字面 量 645， 这 个 问题 将 会 变 得 更 加 复杂 。 我 们 如 何 能 
够 知道 哪个 645 需 要 保留 ， 哪 个 需要 修改 昵 ? 

为 了 解决 这 个 问题 ， 程 序 设计 语言 允许 为 特定 的 不 会 改变 的 值 分 配 一 个 描述 性 的 名 字 。 这 
个 名 字 被 称 为 常量 〈constant)。 例 如 ， 在 C++ 和 C# 语 言 中 ， 声 明 语 各 


CoOTnSL Int 有 ITPOITLA1LLt = 645: 
将 标识 符 Airportalt 与 一 个 固定 的 值 645〈 我 们 认为 它 是 整 型 的 ) 联系 起 来 。 在 Java 语 言 中 ， 
关羽 的 概念 表达 为 

tmal lnt 有 iirportalt = 645， 
很 据 这 些 声明 ， 描 述 性 的 名 字 airportalt 能 够 用 于 字面 量 645 出 现 的 场合 。 在 曾 使 用 这 种 常量 
的 念 代码 中 ， 语 名 

了 ectIVvealt “Itimeter + 645 
可 以 改写 成 

下 于 二 ecCtIVeAJlt 二 有 Limeter + 及 itrPportRlLt 


这 种 方式 能 够 较 好 地 表达 语句 的 含义 。 此 外 ， 如 果 用 这 样 的 常量 来 替代 字面 量 ， 当 程序 要 移植 
到 尺 一 个 海拔 高 度 为 267 英尺 的 机 场 时 ， 仅 仅 修改 这 个 定义 常量 的 声明 语句 就 可 以 将 对 机 场 海 
拔高 度 的 所 有 引用 改 为 新 的 值 。 


6.2.4 赋值 语句 


一 有 旦 声明 了 用 于 程序 的 专门 术语 〈 如 变量 和 常数 )， 程 序 员 就 可 以 开始 描述 涉及 的 算法 了 。 
这 要 依靠 命令 语句 。 最 基本 的 命令 语句 就 是 赋值 语句 〈assignment statement)， 它 将 一 个 值 赋 给 
一 个 变量 〈 更 确切 地 说 ， 存 放 在 该 变量 所 标识 的 存储 区 域 )。 这 样 的 语句 的 语法 结构 通常 是 由 变 
量 和 一 个 代表 赋值 运算 的 符号 以 及 赋值 表达 式 组 成 。 这 个 语句 的 语义 就 是 通过 表达 式 求 值得 到 
结果 ， 从 而 把 结果 作为 变量 的 值 来 存储 。 例 如 ，C、C++、C# 和 Java 语言 中 的 语句 

虽 二 让 十 芷 ; 


”起 将 X 和 Y 相 加 的 和 赋 给 变量 z。 在 一 些 其 他 语言 (如 Ada) 中 ， 等 价 的 语句 可 以 写成 


四 三 


注意 ， 这 些 语句 仅仅 在 赋值 运算 符 语法 表示 上 不 同 ， 在 C、C++、C# 和 Java 语 言 中 ， 仅 仅 使 用 一 


个 符号 ， 而 在 Ada 中 ， 要 用 一 个 冒号 加 等 号 的 形式 来 表示 。 也 许 ， 一 个 更 好 的 赋值 操作 的 符号 
是 APL 语 言 中 所 使 用 的 ，APL 是 由 Kenneth E. Iverson 在 1962 年 设计 的 。(APL 是 A Programming 
. 工 anguage 的 缩写 .) 它 使 用 一 个 箭头 来 表示 赋值 。 因 此 ， 前 面 的 赋值 在 APL 语 言 中 可 以 表示 为 
中 


《正如 第 5 章 的 伪 代 码 中 的 一 样 )。 


赋值 语句 的 许多 功能 都 与 语句 右边 的 表达 式 的 作用 域 关系 密切 。 一 般 而 言 ， 尾 何 一 个 代数 表 
这 式 都 可 以 用 在 赋值 表达 式 中 ， 包 括 用 +、-、* 以 及 / 等 符号 分 别 代表 的 加 、 减 、 乘 、 除 的 典型 
算术 运算 。 一 些 语 言 把 ## 组 合用 来 求 客 。 例 如 ， 在 Ada 中 ， 表 达 式 


| 
=] 
上] 


起 必 


ke 
忆 
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其 审 让 也 
表示 x 。 但 是 ， 各 种 语言 对 这 种 表达 式 的 解释 是 不 一 样 的 。 例 如 ， 从 表达 式 2*4+H6/2， 如 果 是 从 右 
回 左 求 值 ， 可 以 得 到 一 个 值 14， 而 从 左 向 右 求 值 ， 就 得 到 了 7 这 个 结果 。 这 种 不 确定 性 最 终 是 通 
过 运算 符 优 先 级 〈operator precedence) 规则 来 解决 的 ， 这 意味 着 某 些 运算 比 其 他 运算 优先 。 传 统 
的 代数 规则 指定 乘 和 除 要 在 加 与 减 之 前 执行 。 根 据 这 个 惯例 ， 前 面 的 表达 式 的 结果 应 该 是 11。 在 
大 多 数 语言 中 ， 括 号 比 所 有 的 运算 符 的 优先 级 都 高 。 因 此 ，2*#(44+6)/2 的 结果 应 该 是 10。 

许多 程序 设计 语言 多 许 使 用 相同 的 符号 来 表示 多 种 类 型 的 运算 。 在 这 些 情况 下 ， 符 号 的 意 
义 只 能 根据 操作 数 的 数据 类 型 来 决定 。 例 如 ， 当 操作 数 是 数值 时 ， 符 号 + 传统 上 表示 加 法 。 但 在 
某 些 语言 里 ， 如 Java， 当 操作 数 是 字符 串 时 ， 该 符号 表示 连接 。 也 就 是 说 ， 表 达 式 


忆 目 开间 十 让 忆 要 局 蕊 六 总 


的 结果 是 abracadabra。 一 个 运算 符 的 这 种 和 多 种 用 法 称 为 重 载 (overloading )。 


6.2.5 ”控制 语 铝 


控制 语句 〈control statement) 是 一 个 可 以 改变 程序 中 语 名 执行 次 序 的 命令 语句 。 在 所 有 的 
程序 设计 语句 中 ， 某 些 控制 语句 受到 了 极 大 的 关注 并 且 引 发 了 很 大 的 争议 。 主要 起 因 是 最 简单 
的 控制 语句 一 一 goto 语句 。 它 提供 了 一 种 把 执行 顺序 转向 另 一 个 位 置 的 手段 ， 这 个 位 置 是 用 名 
字 或 数 标记 的 ， 这 仅仅 是 机 器 语言 级 的 JUMP 指令 的 直接 应 用 。 高 级 语言 中 的 这 个 特点 ， 意 味 
者 程序 员 将 写 出 像 


号 OtD DO 





20 ”APP1LY PFCOCcedure Evade 
可 已 七 口 7D 
440 工 【《KTrYDPtoOmiIteLeve1l < LethalDosey then getco 6D0 


富 品 七 口 2 
白 癌 APPJIY DFIOCedGurTe ReScueDarmse1l 
7 


这 样 可 读 性 很 差 的 程序 ， 而 仅仅 使 用 一 个 语 名 


1 《KYrYPtoniteDewvel < DethalDose) 
chen 《appLIY Procedure .RescueDamsel) 
人 else 【apply Procedure Evadey) 


就 可 以 完成 相同 的 工作 。 

为 了 避免 产生 这 样 的 复杂 性 ， 现 代 的 程序 设计 语言 设计 出 了 控制 语句 ， 使 得 整个 的 分 支 结 
构 可 以 在 一 条 语句 中 表达 。 选择 什么 样 的 控制 语句 放 到 一 个 语言 中 是 一 种 设计 决策 。 目标 是 只 
要 是 提供 一 种 语言 ， 不 仅 可 以 以 可 读 的 形式 表达 算法 ， 而 且 可 以 帮助 程序 员 获 得 这 种 可 读 性 。 
这 个 目标 可 以 这 样 达到 :;` 限 制 使 用 那些 可 以 导致 不 良 程序 设计 的 特性 ， 间 时 或 励 使 用 优化 设计 
的 特性 。 结 果 是 称 为 结构 化 程序 设计 〈structured programming ) 的 实践 ， 它 包含 了 系统 的 组 织 
设计 方法 ， 包 含 对 控制 语句 的 合理 使 用 。 这 个 方法 的 中 心思 想 就 是 要 设计 容易 理解 的 并 且 满 足 
需求 规格 说 明 的 程序 。 

在 第 5 章 的 伪 代 码 中 ， 我 们 已 经 遇 到 两 种 常见 的 分 支 结构 ， 用 ithen-else 和 while 语 名 表示 。 
这 几乎 出 现在 所 有 的 命令 或 面向 对 象 的 语言 中 ， 更 准确 地 ， 在 C、C++、 C# 和 Java 中 的 伪 代 码 语 
名 如 下 : 
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(CenmnaItIoDm) 
七 五 起 五 【号 记忆 声 忆 me 站 志 疝 】 
但 卫 虽 局 【三 上 号 十 已 站 局 刀 蕊 吾 ) 


和 
While (conaibcIon) ao 
(了 Dop oaw) 


将 被 写成 


工 圭 【 安 口 mGIEIODD) 号 上 号 上 号 有 ED 只 
已 号 已 ”号 二 忌 二 已 由 已 中 本 号 ; 


和 


While (conGIitIoOI) 
{ Loop Podyw} 


注意 这 样 的 事实 ， 这 些 语句 在 4 种 语言 中 是 相同 的 ， 这 是 因为 C++、C# 和 Java 是 命令 性 语言 C 的 
面向 对 象 的 扩展 。 与 之 相反 ， 在 请 言 Ada 中 ， 相 应 的 语句 将 被 写成 : 
IF cenaIrIonm THEN 
号 亡 吕 二 已 由 已 岂 二 员 } 
刁 LSE 


号 万 己 亡 已 屿 玉 士 旦 ; 
END 工 瑟 


和 


WHILE conaiticon LODP 
OoDP DaWw 
END LODE ; 
另 一 个 营 见 的 分 支 结 构 常 用 switch 或 case 语 句 表 示 。 它 提供 了 依据 赋 给 指定 变量 的 值 ， 在 多 
个 选项 中 选择 一 个 语句 序列 的 方法 。 例如 ， 语句 : 
SWitcCh 【VarIaDpIE)  { 
忆 己 号 已 让 1: 局 十 忆 上 已 几 忆 刀 上 上 站 十 T 已 电 长 ， 
电 号 五 "': 号 志 避 上 已 们 忆 刀 上 刀 思 扎 己 大 ; 
性 书号 和 三 二 旺盛 扎 开 扎 刀 二 生 ; 上 b 工 马 己 蕊 ; 
癌 全 于 U]Lt: 号 亡 忆 上 二 人 和 六 记 } 
在 C、C++、C# 和 Java 语 言 中 ，statementa、statementB 或 statementcC 语 名 的 执行 要 取 疾 于 
是 否 当 前 variable 的 值 分 别 是 A、B 或 C。 如 果 variable 的 值 是 其 他 的 值 ， 那 将 执行 
statcementD。 在 Ada 中 ， 相 同 的 结构 将 被 写成 ; 
C 羡 BE VBTrITaDbTIE IS 
WEREN ' 立 ' 三 > 5 上 二 上 meTta; 
WREN "已 ' => 5S 上 aerme 二 号 ; 
人 HEBEN “人 二 > 与 上 号 亡 生 站 己 站 记忆 ， 


WHEN OTHERS = 三 > 号 上 总 亡 已 由 已 刀 记 万 ; 
END CC 总 与 刁 


还 有 疙 外 一 个 称 为 for 结 构 的 常见 控制 结构 〈 如 图 6-7 所 示 )， 这 是 C++、C# 和 Java 语 言 中 的 
表示 。 这 个 循环 结构 与 伪 代 码 中 的 while 语 名 相似 ， 不 同 之 处 在 于 循环 的 所 有 初始 化 、 修 改 和 终 
止 都 在 一 个 语句 中 进行 。 当 循环 体 对 于 指定 范围 内 的 每 个 值 都 要 执行 一 次 时 ， 这 样 的 语句 就 很 
方便 。 特 列 地 ， 图 6-7 中 的 语句 指示 循环 体 被 重复 执行 ， 第 一 次 count 的 值 为 1， 第 二 次 Count 
的 值 为 2 第 三 次 Count 的 值 为 3。 | 


kk 
5 
一 
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给 Count 赋 值 1 


”Count<dpy 二 - 
了 FU 和 
市 
Bag 把 Count. 的 值 加 1 
赋 给 Count 


foer (nt Count = 1 Count<4d4; Counmt + 二 1 
beoay ，: 


图 6-7 C++、C# 和 Java 语 言 中 的 for 循 环 结构 及 其 表示 


程序 设计 语言 文化 

就 像 自 然 语 言 一 样 ， 不 同 程序 设计 语言 的 使 用 者 往往 会 开创 出 不 同 的 文化 ， 并 且 经 常 站 
在 各 自 的 观点 上 争论 语言 之 间 的 优 劣 。 有 的 时 候 这 些 区 别 是 显著 的 ， 就 像 涉及 不 同 的 程序 设 
计 范 型 一 样 。 而 其 他 情况 中 ， 这 种 差异 却 很 微妙。 比如 ， 尽 管 过 程 和 函数 在 字面 上 存在 差异 
(6.3 节 )， 人 得 是 C 语 言 程序 员 把 这 两 者 都 称 作 函数 。 这 是 因为 在 一 个 C 程 序 中 ， 过 程 看 作 是 没 
有 返回 值 的 函数 。 一 个 类 似 的 例子 就 是 C++ 程序 员 把 包含 在 对 象 内 的 过 程 称 为 成 员 诅 数 ， 而 
通常 术语 上 我 们 称 之 为 方法 。 造成 这 种 差异 的 原因 在 于 C++ 是 在 C 语 言 的 基础 上 扩展 而 来 。 另 
外 一 个 文化 差异 是 在 编写 Ada 程 序 的 时 候 ， 保 留 字 通 常 被 加 粗 ， 而 这 种 习惯 对 于 C、C++、 
FORTRAN 和 Java 的 使 用 者 来 说 却 不 常见 。 

尽管 本 书 在 程序 设计 语言 上 保持 中 性 ， 并 且 使 用 通用 的 术语 ， 但 是 每 一 个 特定 例子 都 采 
用 与 包 会 的 程序 设计 语言 相 适应 的 风格 给 出 。 当 你 碰见 这 些 例 子 的 时 候 ， 一 定 要 记 住 的 是 ， 
这 些 例 子 代表 的 实际 上 是 程序 设计 语言 中 一 种 通用 的 思想 ， 而 不 是 作为 传授 某 种 程序 设计 语 
言 细 节 的 一 种 手段 。 不 要 只 见 树 木 不 见 森 林 。 


根据 所 引用 的 例子 ， 我 们 可 以 得 到 这 样 一 个 结论 ， 即 通用 的 分 支 结构 存在 于 所 有 命令 型 程 
序 设 计 语 言 和 面向 对 象 程序 设计 语言 中 ， 而 且 仅 有 细微 的 变化 。 从 计算 机 科学 的 理论 中 我 们 可 
以 了 解 到 一 个 有 些 令 人 吃惊 的 结论 ， 这 就 是 仅仅 需要 这 些 结构 中 的 一 小 部 分 就 足以 保证 程序 设 
计 语言 解决 所 有 可 以 由 算法 解决 的 问题 。 我 们 将 会 在 第 12 章 研究 这 个 问题 。 现 在 ， 我 们 只 是 指 
出 ， 学 习 程 序 设计 语言 不 是 一 个 无 休止 的 学 习 各 种 控制 语句 的 过 程 ， 在 当前 的 程序 设计 语言 中 
可 以 找到 的 大 多 数控 制 结构 本 质 上 是 这 里 介绍 的 这 些 结构 的 变 体 。 


6.2.6 ”注释 


不 管 一 种 程序 设计 语言 设计 得 多 么 好 , 也 不 管 一 个 程序 把 该 语言 的 特性 应 用 得 多 么 出 色 ， 
当 人 们 试图 理解 这 个 程序 时 ， 程 序 附加 的 信息 起 帮助 作用 ， 或 者 是 必须 要 有 的 。 因 此 ， 程 序 
设计 语言 提供 了 可 以 插入 程序 中 的 解释 性 语句 ， 这 些 语 句 就 是 注释 (comment)。 翻译 器 是 忽 
略 注 释 语句 的 ， 因 此 从 计算 机 的 角度 来 说 ， 其 存在 与 否 都 不 影响 程序 的 执行 。 无 论 源 程 序 有 
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没有 注释 ， 对 于 翻译 器 生成 的 程序 机 器 语言 版 本 是 没有 影响 的 ， 但 从 人 的 角度 来 看 ， 这 些 注 
释 是 程序 的 重要 组 成 部 分 。 没 有 这 些 注释 ， 对 于 大 的 复杂 的 程序 ， 程 序 员 对 程序 的 理解 肯定 
会 受到 很 大 的 影响 。 

在 程序 中 加 入 注释 的 方法 通常 有 两 种 。 一 种 是 用 两 个 特殊 的 记号 将 整个 注释 括 起 来 ， 一 个 在 注 
释 的 起 始 位 置 ， 一 个 在 注释 的 尾部 。 另 一 种 是 标示 出 注释 的 起 始 位 置 ， 标 记 符号 右边 的 字符 全 部 都 
属于 注释 。 在 CHH+、C# 和 Java 中 ， 我 们 可 以 同时 看 到 这 两 种 注释 方法 的 应 用 。 它 们 用 记号 /* 和 *V7 
把 注释 括 起 来 ， 或 者 也 可 以 用 记号 // 开 始 一 个 注释 直至 行 末 。 因 此 ， 在 C++、C# 和 Java 中 ， 


1 二 下 ES IIS 己 Commenmnt .二 / 


和 


/This is 已 CDOmmeTt 。 


都 是 合法 的 注释 语句 。 
通常 ， 注 释 要 求 用 词 少 ， 而 且 含义 明确 。 当 为 了 制作 内 部 文档 而 要 求 一 些 初 级 程序 员 使 用 
注释 语句 的 时 候 ， 他 们 给 


aADPPICachaAngle = 31L1PAnGLe 二 HyperspaceIncline; [28: 


这 样 的 语句 写 出 类 似 “ 把 SlipAngle 和 HyperSpaceIncline 相 加 得 到 ApproachAngle 的 值 ”这 样 的 注 
释 。 这 样 的 元 佘 的 话 增加 了 程序 的 长 度 ， 但 却 没有 解释 程序 。 记 住 ， 注 释 的 目的 就 是 解释 程序 ， 
而 不 是 重复 。 对 于 这 条 语句 的 一 个 更 合适 的 注释 应 该 是 解释 为 什么 要 计算 ApproachAngle (如 果 
这 一 点 不 很 明显 的 话 )。 例 如 ， 注 释 “ApproachAngle 将 会 在 计算 ForceFieldJettison Velocity 时 使 
用 ， 并 且 在 此 后 就 不 再 使 用 了 ”就 比 前 面 的 注释 更 有 用 一 些 。 

此 外 ,分 散在 程序 之 中 的 注释 有 时 会 影响 人 们 跟踪 程序 流程 的 能 力 , 因此 使 理解 程序 变 
得 比 没 有 注释 的 时 候 还 要 困难 。 一 个 好 方法 就 是 将 关于 某 个 单一 程序 单元 的 注释 统一 放 在 一 
个 位 置 上 ， 也 许 放 在 该 程序 单元 的 开始 位 置 。 这 就 给 读者 提供 了 程序 单元 注释 的 确切 地 点 ， 
同时 也 提供 了 可 以 用 来 描述 此 程序 单元 的 目的 和 综合 特性 的 地 点 。 如 果 这 个 格式 在 所 有 的 程 
序 单 元 中 都 采用 了 , 写 出 来 的 程序 就 能 在 某 种 程度 上 得 到 一 致 性 一 一 每 个 程序 单元 都 包括 一 
组 解释 性 的 语句 ， 以 及 随后 对 该 程序 单元 的 正式 表示 。 程序 中 的 这 种 一 致 性 提高 了 程序 的 可 
读 性 。 


问题 与 练习 


1. 为 什么 使 用 常量 比 使 用 字面 量 的 程序 设计 风格 更 好 ? 

2. 声明 语句 和 命令 语句 的 区 别 是 什么 ? 

3. 列举 一 些 贡 用 的 数据 其 型 。 

4. 给 出 命令 型 程序 设计 语言 和 面向 对 银 程 序 设计 语言 里 的 一 些 通 用 控制 结构 。 
5. 同 构 数组 和 异 构 数组 之 间 的 区 别 是 什么 ? 





6.3 “过程 单 元 


在 前 面 的 章节 中 ， 我 们 已 经 看 到 了 将 大 程序 拆 分 成 小 的 可 管理 的 单元 的 一 些 好 处 。 在 本 节 
中 , 我 们 将 主要 讨论 过 程 这 个 概念 , 过 程 是 一 个 命令 型 语言 获得 程序 的 模块 化 撕 述 的 主要 技术 。 
而 且 ， 在 面向 对 象 语言 中 ， 过 程 也 是 程序 员 指定 对 象 如 何 响应 外 部 激励 的 工具 。 区 
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6.3.1 ”过程 


从 一 般 的 意义 上 来 说 ， 过 程 (procedure) 就 是 实现 一 个 任务 的 一 组 指令 的 集合 ， 它 能 够 作 
为 其 他 程序 单元 使 用 的 抽象 工具 。 当 请 求 了 过 程 提 供 的 服务 时 ， 程序 的 控制 权 就 转移 给 了 过 程 ， 
在 过 程 执行 完 之 后 ， 程 序 控制 权 返 回 到 最 初 的 程序 单元 〈 图 6-8)。 将 控制 权 转 移 给 过 程 的 步骤 
经 币 称 为 调用 《〈call 或 者 invoke)。 我 们 将 一 个 请 求 过 程 执行 的 程序 单元 称 为 调用 单元 。 


调用 程序 单元 
AL] 到 过 程 过 程 
人 " 潮 过 程 被 执行 
调用 程序 音 ， 
元 继续 和 
当 过 程 完 成 时 ， 控 制 
返回 到 调用 单元 


图 6-8 包含 一 个 过 程 的 控制 流 


在 第 5 章 伪 代 码 中 ， 程 序 通常 是 以 独立 程序 单元 的 形式 来 编写 ， 单元 以 一 个 称 为 过 程 头 
(procedure's header) 的 语句 开始 ， 它 标识 了 《〈 在 其 他 事情 中 间 ) 过 程 的 名 称 。 过 程 头 后面 是 定 
义 过 程 细节 的 语句 。 这 学 语句 往往 以 与 传统 的 命令 程序 相同 的 方式 排列 ， 以 声明 语句 开始 ， 它 
癌 明 了 过 程 中 使 用 的 变量 ， 接 着 是 命令 语句 ， 这 些 命令 语句 描述 了 过 程 执行 时 要 履行 的 步骤 。 

一 般 来 说 ， 在 过 程 中 声明 的 变量 称 为 局 部 变量 〈local variable)， 意味 着 它 只 能 在 这 个 过 程 
的 内 部 使 用 。 如 果 两 个 独立 的 过 程 都 使 用 同一 个 变量 ， 这 很 可 能 产生 一 定 的 混乱 ， 而 通过 局 部 
变量 ， 就 可 以 减少 这 样 的 冲突 。 没有 限制 在 程序 中 某 个 特定 部 分 使 用 的 变量 称 为 全 局 变量 
(global variables)， 它 们 可 以 在 程序 的 任何 地 方 使 用 。 大 多 数 程序 设计 语言 提供 了 声明 局 部 变 
量 和 全 局 变量 的 方法 。) 

相对 于 第 5 章 中 的 伪 代 码 ， 我 们 在 其 中 使 用 了 诸如 “应 用 过 程 DeactiveKrypton” 这 样 的 语 
名 来 请 求 过 程 的 执行 ， 现在 大 多 数 的 程序 设计 语言 允许 只 通过 写 出 过 程 名 来 调用 过 程 。 例如 ， 
如 果 GetNames、SortNames 和 WriteNames 都 是 过 程 的 名 字 ， 它们 的 功能 分 别 是 获得 名 字 的 
列表 、 将 列表 排序 以 及 打印 这 个 列表 ， 那 么 获取 、 排序 及 打印 该 列表 的 程序 可 以 写成 


lw 
已 局 
有 


生息 七 末 忆 Te 号 ; 

号 口 开 上 JameS :; 

WTILeNames: 
而 不 是 

应 用 过 程 GetNames . 


应 用 过 程 SortNames . 
应 用 过 程 WriteNames . 


注意 ， 通过 为 每 一 个 过 程 指定 一 个 可 以 描述 过 程 的 功能 的 名 字 这 种 简明 扼要 的 形式 看 起 来 就 像 
征 反映 该 程序 含义 的 命令 序列 。 
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一 全 vv -~ 一 ”~ 


VISual Basic 


Vilsual Basic 世 微软 公司 开发 的 一 种 面向 对 旬 程 序 设计 语言 ， 通 过 它 ， Windows 操 作 系 统 
的 用 户 可 以 开发 他 们 自己 的 GUI 应 用 程序 .实际 上 ，Visual Basic 不 止 是 一 种 语言 ， 它 还 是 一 
小 完整 的 软件 开发 包 ， 它 双 许 程序 员 利用 预先 定义 的 组 件 ( 如 按钮 、 复 选 框 ， 误 本 框 以 及 滚 
动 条 等 ) 来 构建 应 用 程序 ,并 且 程序 员 可 以 通过 描述 组 件 如 何 响应 不 同事 件 来 定制 这 些 组 件 ， 
例如 ， 对 于 按钮 而 言 ， 程 序 员 可 以 定义 点 击 按钮 时 会 发 生 什 么 事件 .在 第 7 章 ， 我 们 将 会 学 习 
到 ， 这 种 通过 预先 定义 的 组 件 来 构建 软件 的 策略 .是 当 今 软件 开发 技术 的 发 展 趋势 。 

Windows 操 作 系 统 的 流行 与 Visual Basic 开 发 自 的 便 利 性 使 得 Wisual Basic 成 为 当今 广 
泛 使 用 的 程序 设计 语言 。 如 今 微软 公司 又 开发 出 了 C#， 这 种 优势 是 否 能 够 继续 我 们 将 技 
目 以 竺 . 


6.3.2 ”参数 


过 程 通 溃 会 使 用 一 些 通用 项 ， 这 些 项 只 有 在 过 程 被 执行 的 时 候 才 可 以 确定 下 来 。 例 如 ， 第 
5 章 中 的 图 5-11 给 出 了 一 个 列表 排序 过 程 的 伪 代 码 ， 其 中 的 列表 不 是 某 个 特定 的 列表 ， 而 是 -- 
个 通用 的 列表 。 在 伪 代 码 中 , 我 们 可 以 在 过 程 头 部 的 括号 中 标识 出 这 些 通用 项 。 因 此 , 在 图 5-11 
中 ， 过 程 以 


procedure Sort(Lisf 


开始 ， 并 将 使 用 List 来 指 代 需 要 排序 的 列表 ， 从 而 进一步 描述 列表 排序 过 程 。 如 条 我 们 要 应 用 这 
个 过 程 来 为 一 个 参加 婚礼 的 客人 列表 排序 ， 我 们 仅仅 需要 假设 通用 项 List 指 代 参 加 婚礼 的 客人 列 
表 。 如 果 我 们 将 要 排序 一 个 会 员 列 表 ， 我 们 只 要 将 通用 项 List 解 释 成 该 会 员 列 表 .。 

过 程 内 部 的 这 些 通用 项 称 作 参 数 (parameter)。 更 准确 地 说 ， 这 些 在 过 程 内 部 使 用 的 项 称 为 
形 参 formal parameter),， 并 且 当 过 程 被 调用 的 时 候 , 赋 给 形 参 的 值 称 为 实 参 (actual parameter )。 
在 某 种 程度 上 ， 形 参 就 像 是 过 程 体 上 的 槽 口 ， 而 当 过 程 被 调用 的 时 候 ， 实 参 就 好 似 被 塞 入 了 这 
个 槽 口中。 

就 伪 代 码 来 说 ， 大 多 数 编程 语言 要 求 : 定义 一 个 过 程 时 ， 形 式 参数 要 列 在 过 程 头 的 括号 
里 。 例 如 ， 图 6-9 给 出 了 用 C 语 言 编写 的 名 字 是 projectpopulation 的 过 程 的 定义 。 该 过 程 期 
望 在 它 被 调用 的 时 候 ， 给 它 一 个 确定 的 年 增长 率 值 。 在 这 个 增长 率 的 基础 上 ， 假设 初始 数量 
为 100， 过 程 计 算出 未 来 10 年 中 某 个 种 群 的 数量 ， 并 且 将 结果 存储 在 称 为 Population 的 全 局 
数组 中 。 

大 多 数 程序 设计 语言 在 调用 过 程 的 时 候 也 使 用 括号 来 标识 实 参 。 也 就 是 说 ， 幸 用 过 程 的 语 
名 要 包括 过 程 的 名 字 以 及 括号 中 的 实 参 的 列表 。 因 此 ， 像 

使 用 增长 率 0.03 应 用 过 程 ProjectEopulation 
这 样 的 伪 代 码 语句 可 以 用 C 语 言语 名 

PYO]JectPBopulaticntD.031 ， 
表示 ， 它 是 用 增长 率 的 值 为 0.03 来 调用 图 6-9 中 的 过 程 ProjectPopulation。 

当 过 程 不 只 包含 一 个 参数 的 时 候 ， 实 参 要 与 过 程 头 部 的 形 参 序列 一 一 对 应 一 一 第 一 个 实 参 
对 应 第 一 个 形 参 ， 依 此 类 推 。 然 后 ， 实 参 的 值 就 可 以 有 效 地 传递 给 它们 相对 应 的 那个 形 参 ， 从 
而 过 程 得 以 执行 。 

为 了 强调 这 一 点 ， 假 设 过程 Printcheck 使 用 这 样 的 过 程 头 来 定义 ， 


医 


区 
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以 veoia 开 始 头 部 是 C 语 言 形 参 列表 。 注 意 ， 像 大 多 
程 谋 员 指 定 程序 单元 是 过 数 程序 设计 语言 一 样 ，C 
杜 而 不 是 函数 的 方法 。 我 语言 村 求 对 每 个 参数 说 明 
们 很 快 就 学 到 函数 函数 类 型 


有 三 总]JectPeopulaticon 人口 at GOFowthRate) 


一 声明 一 个 名 为 Year 的 局 部 变量 


(一 


PopUJLat1iIDOr[O] = 100 0， * 
开 GT Yar 二 上 自 : Year =< 10 Year +1+ 
FoOpulatlon[Year+1] = Population[Yearl + 在昌 让 让 二 站 二 让 交 矶 [全 所 二 站] 沁 个 工 总 WW 七 拉 及 二 七 总 


这 些 语 句 描 述 人 口 是 如 何 计算 并 存储 在 
匠 为 Populatcion 的 全 局 数组 中 的 





图 6-9 用 C 语 言 编写 的 过 程 ProjectPopul 纪 七 荆 口 习 
Preocedure PrintCheck(Payee ， &armecunmt ) 


来 定义 过 程 ， 其 中 Payee 和 amount 是 过 程 的 形 参 ， 它们 分 别 指 代 了 将 支票 支付 给 的 那个 人 以 及 
文 票 的 数额 。 那 么 ， 用 语句 

PrImtCheck(IJohn Doe*,150) 
调用 过 程 ， 将 会 使 得 形 参 Payee 与 实 参 John Doe 对 应 ， 形 参 amount 与 实 参 150 对 应 ， 从 而 过 程 得 
以 执行 。 但 是 使 用 语句 


Pramnteheck(150 ， John Doens } 


击 用 过 程 将 会 使 得 值 150 赋 给 Payee， 而 John Doe 冉 给 形 参 amount ， 而 这 必定 导致 错误 的 结果 。 

形 参 和 实 参 之 间 的 数据 传递 ， 不 同 的 程序 设计 语言 有 不 同 的 处 理 方法 。 在 某 些 语言 中 ， 对 
于 实 参 所 表示 的 数据 产生 一 个 副本 传 给 了 过 程 。 使 用 这 种 方法 ， 任何 过 程 对 数据 的 修改 仅仅 是 
对 副本 的 修改 一 一 调用 程序 中 的 数据 并 没有 被 修改 ， 我 们 称 之 为 按 值 传递 (pass by value)。 注 
意 ， 按 值 传递 参数 保护 了 调用 单元 中 的 数据 不 会 被 设计 有 问题 的 过 程 错 误 地 修改 。 例如 ， 如 果 
调用 单元 传递 一 个 雇员 的 名 字 给 一 个 过 程 ， 我 们 当然 希望 过 程 不 要 改变 这 个 名 空 。 

但 是 ， 当 参数 是 一 个 很 大 的 数据 块 时 ， 按 值 传递 参数 效率 不 高 。 一 个 更 高 效 地 给 过 程 传递 参数 

288| 的 方法 ,就 是 告诉 过 程 它 所 需 的 实 参 的 地 址 ， 从 而 使 过 程 可 以 对 实 参 进行 直接 存 取 。 对 于 这 种 方法 ， 

我 们 称 为 按 引 用 传递 〈pass by reference)。 注 意 ， 接 引 用 传递 允许 程序 修改 调用 单元 中 的 数据 。 这 
个 方法 对 于 为 列表 进行 排序 的 过 程 来 说 是 很 有 用 的 。 调 用 这 样 的 过 程 很 有 可 能 导致 列表 的 改变 。 

例如 ， 让 我 们 假设 一 个 过 程 bemo 定义 为 


ETOCeaGure Demo (Ecormnal1) 
FoOrmal FoOrmal + 1: 


此 外 ， 假 设 变量 actual 被 赋予 一 个 值 5， 我 们 用 下 面 语 句 调用 Demao， 
Deme (CCtUal) 


然后 ， 如 果 参 数 是 按 值 传递 的 ， 在 过 程 中 对 Formal 的 改变 ， 不 会 影响 变量 actual1 的 值 《参见 
图 6-10)。 但 是 ， 如 果 是 按 引用 传递 的 话 ， 那么 Actual 的 值 将 会 增加 1 〈 人 参见 图 6-11)。 








(a) 当 过 程 被 调用 时 ， 数 据 的 副本 给 该 过 程 
一 
调用 环境 过 程 的 环境 





(b) 该 过 程 操纵 它 的 副本 





图 6-10 ”执行 过 程 pemo， 按 值 传递 方式 传递 参数 


调用 环境 过 程 的 环境 





(a) 当 过 程 被 调用 时 ， 形 参 变 成 对 实 参 的 引用 


调用 环境 过 程 的 环境 






” 如 3 四 


(b) 于 是 ， 该 过 程 所 做 的 改变 是 对 实 参 的 


调用 环境 





(ec) 因此 ， 在 过 程 终止 后 被 保留 下 来 了 


图 6-11 执行 过 程 Demo， 按 引用 传递 方式 传递 参数 
不 同 的 程序 设计 语言 提供 了 不 同 的 传递 参数 的 技术 ， 但 是 在 任何 情况 下 ， 参 数 的 使 用 都 允 


ko 
\ 呈 
己 
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许 过 程 以 通用 的 意义 书写 ， 并 在 适当 的 时 候 应 用 于 特定 的 数据 。 
6.3.3 ”函数 


让 我 们 暂停 一 下 来 考虑 过 程 概念 的 一 个 微小 的 变化 ， 该 变化 可 以 在 许多 程序 设计 语言 中 发 
现 。 有时, 过程 的 目的 是 要 产生 一 个 值 ， 而 不 是 完成 一 个 动作 。 (考虑 这 样 两 个 过 程 之 间 的 差别 ， 
一 个 过 程 是 估计 售 出 的 小 商品 的 数量 ， 另 一 个 过 程 用 来 玩 一 个 小 游戏 ， 前 者 重点 是 为 了 产生 一 
个 值 ， 而 后 者 是 为 了 完成 一 个 动作 。) 如 果 目 的 是 产生 一 个 值 ， 那 么 这 个 “过 程 ” 是 作为 一 个 函 
数 来 执行 的 。 这 里 ， 函 数 (function) 是 指 一 个 类 似 于 过 程 的 程序 单元 ， 但 它 把 一 个 值 作为 “该 
函数 的 值 ”传递 给 调用 程序 单元 。 也 就 是 说 ， 图 数 的 执行 就 是 计算 出 一 个 值 并 且 将 这 个 值 送 回 
到 调用 单元 中 。 这 个 值 可 以 存储 在 一 个 变量 里 为 以 后 使 用 ， 也 可 以 立即 用 于 计算 。 例 如 ，C、 
C++、jJava 或 者 C# 的 程序 员 可 以 编写 


Pro]JectedJansSsales = ESt1limateaSsales (Januarv+ ，; 


来 把 调用 函数 Bstimtedsales 产 生 的 结果 -一 一 月 份 共 售 出 了 多 少 小 商品 ， 赋值 给 变量 
ProjectedJansSales。 或 者 ， 程 序 员 可 以 写 


灶 (LastJanSales < Estimatedsales(Januarv)). 
全 上 世人 ，- 


依据 今年 一 月 份 的 销售 是 否 好 于 去 年 同期 来 产生 不 同 的 动作 。 注 意 ， 在 第 二 种 情况 中 ， 由 函 数 
直 算 出 来 的 值 用 来 决定 执行 哪个 分 支 ， 但 是 并 没有 被 存储 起 来 。 

在 程序 中 定义 函数 的 方式 与 定义 过 程 的 方式 基本 相同 。 它们 的 不 同 仅 仅 在 于 : 函数 头 部 通 
党 以 指定 返回 值 的 数据 类 型 开始 ， 以 返回 语句 来 结束 函数 定义 一 一 这 个 返回 语句 明确 了 返回 值 。 
图 6-12 给 出 了 函数 cvlindaervolume 的 C 语言 定义 。( 实 际 上 ， 一 个 真正 的 C 程序 员 会 使 用 
一 种 更 简洁 的 方式 , 我 们 之 所 以 使 用 这 种 详细 的 样式 是 为 了 教学 的 需要 。) 当 函数 被 调用 的 时 候 ， 
函数 的 形 参 Radius 和 Height 接受 确定 的 值 ， 并 且 使 用 这 些 参 数 ， 返回 经 过 计算 得 到 的 圆柱 
体积 值 。 因 此 ， 在 程序 的 其 他 地 方 ， 语 各 


CosSt = CostPerVe1lLUnitL 二 CvyliInaerVolume1l3 .45， 上 上 也 二 证 下 二 
用 来 调用 这 个 函数 ， 以 求 出 一 个 半径 为 3.45， 高 为 12.7 的 圆柱 的 费用 。 


函数 头 部 以 要 返回 数 
据 的 类 型 作为 开始 


LDOaCCcylinderVolume (上 ]cat 肛 忆 局 1US， 上 于 土 扣 二 上 上 鞭 闸 主要 所 七 ) 


{ 主 上 eat Volume 一 一 声明 一 个 名 为 Volume 
的 局 部 变量 


VDJTtime = 了 .开赴 二 谎 辣 加 并 各 二 黄 二 ie 二 已 工 村 拉 七 ; 





人 计算 圆柱 体 的 体积 


} ee 举止 函数 并 返回 变量 


二 癌 Lume| 的 值 


站 es ee 


图 6-12 ”用 C 语 言 编写 的 函数 cylindervolume 
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事件 驱动 软件 系统 

文中 ， 在 我 们 已 经 考虑 过 的 情况 中 ， 过 程 的 激活 都 是 作为 程序 中 其 他 位 置 的 语 向 明确 地 
调用 过 程 的 结果 。 此 外 ， 还 有 一 些 情况 是 这 样 的 ， 过 程 是 由 一 个 事件 的 发 生 而 激活 的 ， 例 如 
在 GUI 中 ， 过 程 描 述 了 当 一 个 按钮 被 点 击 的 时 候 应 该 产生 什么 动作 ， 这 种 过 程 不 是 由 其 他 程 
序 单 元 调用 的 ， 而 是 作为 点 击 按钮 这 一 事件 的 结果 。 这 种 过 程 是 通过 事件 而 不 是 明确 的 请 求 
业 激 活 的 软件 系统 称 作 事件 驱动 (event-driven ) 系统 。 简 言 之 ， 一 个 事件 驱动 软件 系统 是 由 
这 样 的 过 程 组 成 : 它们 描述 各 种 事件 发 生 时 应 该 做 什么 。 当 系统 执行 时 ， 这 些 过 程 等 待 ， 直 
到 与 它们 对 应 的 事件 发 生 ， 然 后 它们 激活 ， 完 成 它们 的 任务 后 回 到 等 待 状 态 . 


问题 与 练习 
1. 全 局 变量 和 局 部 变量 的 区 别 是 什么 ? 
2. 过 程 和 函数 的 区 别 是 什么 ? 
3. 为 什么 许多 程序 设计 语言 执行 JO 操 作 的 方式 很 像 是 调用 过 程 ? 
4 形 参 和 实 参 的 区 别 是 什么 ? 
5 当 用 一 个 现代 程序 设计 语言 来 写 程序 时 , 程序 员 都 倾向 于 使 用 动词 来 命名 过 程 , 使 用 名 词 来 命名 函数 ， 
为 什么 ? 


二 1 后 HR = 证 本 ET 下 ArialcPiHPncSELFLA 训 革 


6.4 语言 实现 
在 本 下 中 ， 我 们 将 研究 把 高 级 语言 编写 的 程序 转换 为 机 器 可 执行 形式 的 过 程 。 


6.4.1 翻译 过 程 


将 一 个 程序 从 一 种 语言 转换 为 另 一 种 语言 的 过 程 称 为 翻译 〈translation)。 原 始 形式 的 程序 
称 作 源 程 序 〈source program)， 翻 译 后 的 版 本 称 作 目标 程序 (object program)。 翻 译 过 程 包括 3 
部 分 工作 ， 分 别 是 词法 分 析 、 语 法 分 析 和 代码 生成 ， 实 现 相 应 行为 的 单元 分 别称 为 词法 分 析 器 
(lexical analyzer)、 语 法 分 析 器 〈parser)， 以 及 代码 生成 器 〈code generator) 〈 参 见 图 6-13 )。 


源 程 序 二 现 计 分析 器 一 -下 语法 分 析 器 代码 生成 器 目标 程序 


图 6-13 ”翻译 过 程 


词法 分 析 是 识别 源 程序 中 构成 单个 实体 的 符号 串 的 过 程 。 例 如 ，3 个 符号 的 153 不 应 该 解释 
成 一 个 1、 一 个 5 和 一 个 3， 而 是 应 该 识别 出 它们 代表 一 个 数值 。 同 样 ， 程 序 中 的 一 个 单词 ， 尽 管 
由 单个 的 符号 组 成 ， 也 应 该 解释 成 一 个 单元 。 大 多 数 人 进行 词法 分 析 都 是 下 意识 的 。 当 要 求 大 
声 庆 读 的 时 候 ， 我 们 都 是 读 出 一 个 词 来 ， 而 不 是 逐个 读 出 单个 字母 。 

因此 ， 词 法 分 析 器 逐个 符号 地 读 源 程 序 ， 并 且 识 别 出 哪 些 符号 的 组 合 可 以 代表 -一 个 单元 ， 
并 且 根据 它们 是 否 是 数 、 词 、 算 术 运 算 符 等 来 将 这 些 单 元 分 类 。 每 个 单元 分 类 的 同时 ， 词 法 分 
本 器 在 一 个 称 为 标记 〈token) 的 包 中 编译 该 单元 及 其 分 类 ， 并 将 这 个 标记 提交 给 语法 分 析 器 。 


la 


加 
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在 此 过 程 中 ， 词 法 分 析 器 跳 过 了 所 有 的 注释 语句 。 

因此 ， 语 法 分 析 器 将 程序 看 作 是 由 词法 单元 〈 标 记 ) 组 成 的 ， 而 不 是 由 单个 符号 组 成 的 。 
语法 分 析 器 的 工作 就 是 将 这 些 单 元 组 合成 语句 。 实 际 上 ， 语 法 分 析 是 标识 程序 中 语法 结构 和 辩 
认 每 个 成 分 作用 的 过 程 。 正 是 语法 分 析 技术 使 得 人 们 在 读 句子 


The man the horse that won the race threw was naot hurt， 


时 ， 会 停顿 一 下 。( 试 一 试 这 句 话 :“That that is is . That that is not js not That that is not is not that 
that is.“! ) 

为 了 简化 语法 分 析 进 程 ， 早 期 程序 设计 语言 坚持 每 个 程序 的 语句 都 要 以 一 种 特定 的 方式 定 
位 在 打印 页 上 。 这 种 语言 称 为 固定 格式 语言 (fixed-format language)。 今 天 ， 大 多 数 程序 设计 语 
言 都 是 自由 格式 语言 〈free-format language)， 和 意味 者 不 再 苛求 语句 的 位 置 安排 了 。 从 人 的 角度 
来 看 ， 上 由 格式 语言 的 好 处 在 于 程序 员 可 以 编写 可 读 性 更 高 的 程序 。 在 这 种 情况 下 ， 通 常 使 用 
缩 进来 帮助 读者 更 好 地 把 握 语句 的 结构 。 对 于 一 个 程序 员 ， 不 应 该 写 


t Cost < _ CashonHanad t 上 ben 站 aaY W1LtD Cash 所 二 和 全 US 所 
CI 所 总 1 七 “ 尼 引 IT 昌 


而 应 该 写 
t Cost < _ CashonHand 
七 ezRn 记 ay with cashn 


扣 ] 呈 人 USe CreaQit Catr 刀 

对 于 一 台 计 算 机 ， 为 了 分 析 以 自由 格式 语言 形式 编写 的 程序 ， 程序 设计 语言 的 语法 必须 设 

计 用 来 识别 程序 的 结构 ， 而 不 管 源 程序 使 用 了 多 少 空格 。 为 了 达到 这 个 目的 ， 大 多 数目 由 格式 

语言 都 使 用 诸如 分 号 这 样 的 标点 符号 来 表示 语句 的 结束 ， 另 外 还 使 用 诸如 jf、 then 和 else 

这 样 的 关键 字 (key word ) 来 表示 单个 短语 的 开始 。 这 些 关 键 字 通 常 都 是 保留 字 (reserved word )， 
网 是 说 程序 员 在 程序 中 不 能 把 它们 用 于 其 他 目的 。 


Java 和 C# 的 实现 


在 某 些 情况 下 ， 如 控制 动画 网 页 ， 软 件 必 须 经 过 因特网 传送 ， 且 在 远程 机 器 上 执行 ， 如 
水 软件 是 以 源 程序 形式 提供 ， 那 在 目的 地 将 产生 额外 的 延迟 ， 这 是 因为 软件 在 执行 前 要 被 翻 
香 克 合适 的 机 器 语言 。 但是， 以 机 器 语言 的 形式 提供 软件 意味 着 要 根据 远程 计算 机 上 使 用 的 
机 器 语言 提供 不 同 版 本 的 软件 。 

通过 设计 能 够 翻译 源 代码 的 “通用 机 器 语言 ”( 在 Java 中 称 之 为 字 节 编码 ， 在 C# 中 称 之 
为 .NET 通 用 中 间 语 言 ]，Sun Microsystems 和 微软 解决 了 此 问题 晶 然 这 些 语 言 沙 是 真实 的 机 
花语 言 ， 但 它们 被 设计 成 快速 可 翻译 的 。 这样 ， 如 果 用 Java 或 C# 编 写 的 软件 被 翻译 成 合适 的 
“通用 机 器 语言 >， 那么 它 能 被 传送 到 因特网 中 的 另外 一 和 台 机 器 上 在 那里 被 高 效 地 技 行 ， 在 
某 些 情 况 下 ， 这 个 执行 是 由 解释 器 来 完成 的 : 在 其 他 一 些 情况 下 ， 通 用 机 器 语言 在 执行 前 被 
快速 翻译 ， 这 个 过 程 被 称 为 及 时 编译 (just-in_time compilation )。 


十 法 分 析 过 程 基于 一 系列 语法 规则 ， 这 些 规则 定义 了 程序 设计 语言 的 语法 。 如 的 来 说 ， 这 
些 规则 称 为 文法 〈grammar), 表达 这 些 规则 的 一 种 方法 是 借助 语法 图 〈syntax diagram)， 它 是 
程序 文法 结构 的 图 形 化 表示 。 图 6-14 给 出 了 第 5 章 伪 代 码 中 的 if-~then-else 语句 的 语法 图 。 这 
个 图 描述 了 if-then-else 的 结构 ， 该 结构 以 关键 字 if 开始 ， 然后 是 一 个 布尔 表达 式 ， 接 着 关键 
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字 then， 随 后 是 一 个 语 身 。 此 结构 的 后 面 有 没有 else 和 话 揣 都 是 允许 的 。 注 意 ， 实 际 出 现在 
if-then-else 语句 中 的 项 都 是 用 椭圆 形 框 的 ， 而 需要 进一步 描述 的 项 ， 诸 如 布尔 表达 式 和 语句 

等 ， 都 在 矩形 框 中 。 和 需要 进一步 描述 的 项 《和 矩形 框 中 的 ) 称 为 非 终 结 符 〈nonterminal)， 而 出 现 

在 椭圆 形 框 中 的 项 称 为 终结 符 〈terminal)。 在 一 个 程序 设计 语言 语法 的 完整 描述 中 ， 非 终结 符 

由 额外 的 图 表 描 述 。 


一 人 》 -. 布尔 到达 式 一 人 一 语句 下 于 及 语 各 下 


aa CN ] - | 
图 6-14 if-then-else 仿 代码 语句 的 语法 图 


作为 一 个 比较 完整 的 例子 ， 图 6-15 给 出 了 一 组 语法 图 ， 它 描述 了 一 个 称 为 表达 式 〈 可 以 是 
简单 的 数学 表达 式 结 构 ) 的 结构 的 语法 。 第 一 个 图 描述 了 一 个 表达 式 由 一 个 项 〈term) 组 成 ， 
后 面 可 以 跟 〈 也 可 以 不 跟 ) 一 个 + 号 或 -号 ， 运 算 符 后 面 跟 有 另 一 个 表达 式 。 第 二 个 图 描述 了 一 
个 项 由 单个 因子 组 成 ， 或 者 由 一 个 因子 后 面 跟 一 个 x 号 或 + 号， 然后 再 跟 男 一 个 项 组 成 。 最 后 一 
个 图 描述 了 因子 由 x、Yy、z 中 的 一 个 字符 组 成 。 





表达 式 








因子 


图 6-15 ”一 个 简单 的 代数 表达 式 的 语法 图 


判断 一 个 特定 的 串 是 否 符 合 一 组 语法 图 的 方法 还 可 以 用 请 法 分 析 树 (parse tree) 进行 图 形 
化 表示 ， 根 据 图 6-16 中 所 示 的 语法 图 ， 图 6-16 描述 了 字符 串 x+yxz 的 语法 分 析 树 。 注 意 ， 树 
的 顶端 以 非 终 结 符 表达 式 开 始 ， 并 且 在 每 一 层 都 给 出 了 本 层 的 非 终结 符 是 如 何 分 解 的 ， 这 个 过 
程 直 到 获得 该 串 本 身 中 的 全 部 符号 才 结 束 。 该 图 还 特别 说 明 〈 根 据 图 6-15 中 的 第 一 个 图 )， 一 
个 表达 式 可 以 分 解 成 一 个 项 ， 后 面 跟 有 + 号 ， 然 后 再 跟 一 个 表达 式 。 接 着 ， 项 可 以 分 解 成 〈 用 图 
6-15 中 的 第 二 个 图 ) 一 个 因子 《结果 是 符号 x)， 最 后 的 表达 式 可 以 分 解 〈 用 图 6-15 中 的 第 三 个 
图 ) 为 一 个 项 〈 结 果 是 yxz)。 
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图 6-16 ”基于 图 6-15 的 x+yxz 字 符 串 的 语法 分 析 树 


语 活 分 析 过 程 本 质 上 就 是 为 源 程序 构建 语法 分 析 树 的 过 程 。 的 确 ， 一 个 语法 分 析 树 代表 了 
证 法 分 析 器 对 程序 文法 构成 的 理解 。 因 此 ， 描 述 程序 文法 结构 的 语法 规则 是 不 允许 同 -- 个 字符 
趾 出 现 两 个 不 同 的 语法 分 析 树 的 ， 因 为 这 将 导致 语法 分 析 器 内 部 发 生 混乱 。 如 果 一 个 文法 允许 
同一 个 字符 串 有 两 个 不 同 的 语法 分 析 树 ， 我 们 称 之 为 多 义 文 法 (ambiguous grammar )。 

许 法 中 的 这 种 歧义 是 很 细微 的 。 事 实 上 ， 图 6-14 中 所 示 的 规则 存在 这 样 的 缺陷 ， 对 于 下 而 
的 语句 可 以 生成 如 图 6-17 所 示 的 两 个 语法 分 析 树 ， 


上 有 rthen if &2then 7 else 97 


注意 ， 这 两 个 解释 是 明显 不 同 的 。 第 一 个 表示 语句 92 在 81 为 假 时 执行 ;而 第 二 个 表示 语句 92 
仅 当 87 为 真 并 且 82 为 假 时 执行 。 
正式 的 程序 设计 语言 的 语法 定义 要 避免 这 样 的 混乱 。 在 伪 代 码 中 ， 我 们 通过 使 用 括号 来 避 
锡 这 样 的 问题 。 我 们 可 以 写 
if 87 
then (if 82then 57) 
ese .942 


以 及 


用 厅 7 
then (if 及 2 thenm 7 
已 15 忆 上 东 20 


来 区 分 这 两 种 可 能 的 解释 。 

当 语 法 分 析 器 分 析 一 个 程序 的 文法 结构 时 ， 它 能 够 标识 单独 的 语句 ， 并 能 够 区 分 声明 语句 
和 命令 语句 。 当 识别 声明 语句 时 ， 它 将 这 些 声 明 的 信息 记录 在 一 个 符号 表 《symbol table) 中 。 
四 此 符号 表 中 包含 了 诸如 变量 的 声明 信息 和 与 其 对 应 的 数据 类 型 和 数据 结构 的 信息 。 然后 ， 当 
分 析 到 
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AN 


计 布尔 表达 式 then el|se 


8 NAN 本 


f 布尔 表达 式 ”then ”语句 


日 z 池 1 


下 


计 布 示 于 达 式 then 


LA 人 NSNN 


] 布尔 琳 状 起 then 语 馈 四 1S 昌 语句 


| 与 过 
图 6-17 语句 if 81then if 8B2then 5$1 else 452 的 两 个 不 同 的 语法 分 析 树 
中 


这 样 的 傅 令 语句 时 ， 语 法 分 析 器 会 以 这 些 信息 为 依据 来 进行 分 析 。 特 别 是 ， 为 了 确定 符号 + 的 合 
义 ， 语 法 分 析 器 必须 要 知道 x 和 y 的 数据 类 型 。 如 果 x 是 实 型 而 y 是 字符 型 ， 将 x 和 Y 相 加 是 没有 任 
何 意义 的 ， 并 且 将 会 报告 出 错 ; 如 果 x 和 Y 都 是 整 型， 那么 语法 分 析 器 将 会 请 求 代 码 生 成 器 生成 
相应 的 整数 加 法 操作 码 的 机 峰 语 言 指令 ， 如 和 朱 x 和 Y 都 是 实 型 ， 那 么 语法 分 析 器 将 会 请 求 代码 生 
成 器 生成 相应 的 译 点 数 加 法 操作 码 的 机 器 语言 指令 ， 如 果 都 是 字符 类 型 ， 语 法 分 析 器 将 会 请 求 
代码 生成 器 建立 一 串 机 器 语言 指令 来 完成 相应 的 操作 。 

如 果 x 是 整 型 而 Y 是 实 型 ， 这 种 特殊 的 情况 加 法 的 概念 是 可 用 的 ， 但 是 值 不 能 以 兼容 的 形 
式 编码 。 在 这 种 情况 下 ， 语 法 分 析 器 可 能 选择 使 代码 生成 器 生成 指令 把 其 中 的 一 个 值 转 换 为 另 
一 种 类 型 ， 然 后 再 执行 加 法 运算 。 这 种 类 型 的 隐 式 转换 称 为 强制 类 型 转换 〈coercion )。 

许多 程序 设计 语言 的 设计 者 都 反对 强制 类 型 转换 。 他 们 认为 ， 经 常 需要 强制 类 型 转换 就 
意味 着 程序 设计 语言 在 设计 上 存在 丝 漏 ， 因 此 不 应 该 使 用 语法 分 析 器 来 迁就 。 因 此 ， 大 多 数 
现代 程序 设计 语言 都 是 强 类 型 (strongly typed) 的 ,这 意味 着 一 个 程序 请 求 的 动作 必须 包含 允 


吕 
交 


194 第 6 章 程序 设计 语言 


许 的 数据 类 型 ， 不 允许 强制 类 型 转换 。 这 些 语言 的 语法 分 析 器 将 把 所 有 的 类 型 冲突 当 作 错 误 
来 报告 。 

翻译 过 程 的 最 后 一 步 就 是 代码 生成 〈code generation )， 它 是 生成 机 器 语言 指令 以 实现 语法 
分 析 器 识别 出 的 语句 的 过 程 。 这 个 过 程 涉及 许多 问题 ， 其 中 一 个 就 是 要 生成 效率 高 的 代码 。 例 
如 ， 我 们 考察 语 铝 

上 二 

内 < 一 二 二; 
的 翻译 工作 。 如 果 这 些 语句 作为 单个 语句 来 进行 翻译 ， 那 么 在 执行 加 法 操作 之 前 ， 每 一 条 语句 
都 需要 数据 从 主 存 传送 到 CPU。 然 而 ， 效 率 可 以 通过 这 样 的 认识 获得 ，-- 旦 第 一 条 语句 被 执行 
之 后 ，x 和 z 的 值 已 经 存在 于 CPU 的 通用 寄存 器 中 ， 所 以 执行 第 二 条 语句 的 时 候 就 不 再 需要 从 内 
存 中 读 取 这 两 个 数 了 。 这 种 方法 就 称 作 代码 优化 〈code optimization )， 它 是 代码 生成 器 的 一 个 
非常 重要 的 工作 。 

最 后 ， 我 们 应 到 注意 的 是 ， 词 法 分 析 、 语 法 分 析 和 代码 生成 这 3 个 步骤 并 不 是 严格 按照 顺 
序 来 执行 的 。 相 反 ， 这 些 步骤 是 交织 在 一 起 的 。 词 法 分 析 器 从 源 程序 中 读 取 字 符 ， 并 且 标 识 出 
第 一 个 标记 。 它 将 这 个 标记 传送 给 语法 分 析 器 。 每 当 语法 分 析 器 从 词法 分 析 器 接收 一 个 标记 时 ， 
训 开 始 分 析 读 取 的 文法 结构 。 此 时 ， 它 可 能 会 向 词法 分 析 器 请 求 另 一 个 标记 ， 或 者 如 果 语 法 分 
析 器 认为 已 经 读 到 了 一 个 完整 的 短语 或 者 语句 ， 那 么 它 就 会 请 求 代码 生成 器 产生 相应 的 机 器 指 
令 。 每 一 个 这 样 的 请 求 都 会 使 代码 生成 器 生成 机 器 指令 ， 并 且 将 其 加 入 到 目标 程序 中 。 将 一 个 
程序 从 一 种 语言 翻译 成 另 一 语言 的 工作 很 自然 符合 面向 对 象 范 型 。 源 程序 、 词 法 分 析 器 、 语 法 
分 析 器 、 代 码 生成 器 以 及 目标 程序 本 身 都 是 对 象 ， 每 一 个 对 象 都 在 实现 自己 的 任务 的 同时 通过 
来 回 传递 消息 与 其 他 对 象 进行 交 互 〈 见 图 6-18)。 


源 程序 
ER 
词法 分 析 器 
[| 代码 生成 器 
\ 


”1 


目标 程序 
图 6-18 ”翻译 过 程 的 面向 对 象 方法 
6.4.2 ”软件 开发 包 


像 编 辑 器 和 翻译 器 这 样 的 在 软件 开发 过 程 中 应 用 的 软件 工具 ， 通 常 组 合成 一 个 软件 包 ， 来 
实现 一 个 集成 的 软件 开发 系统 的 功能 。 根 据 在 3.2 节 中 的 分 类 框架 ， 这 样 的 系统 属于 应 用 软件 。 
通过 使 用 该 应 用 软件 包 ， 程 序 员 可 以 很 方便 地 在 一 个 编辑 器 中 编写 程序 ， 使 用 翻译 器 将 程序 转 
换 成 机 器 语言 ， 并 且 可 以 使 用 各 种 各 样 的 调试 工具 来 跟踪 出 错 程序 的 执行 ， 以 发 现 哪里 出 现 了 
问题 。 

使 用 这 样 的 集成 系统 的 好 处 很 多 ， 最 明显 的 就 是 程序 员 在 需要 修改 和 测试 程序 时 ， 可 以 很 
容易 在 编辑 器 和 调试 工具 之 问 来 回 倒 换 。 此 外 ， 许 多 软件 开发 包 人 允许 开发 中 的 相关 程序 单元 以 
这 往 的 方式 连接 ， 使 得 对 相关 程序 单元 的 存 取 简化 了 。 一 些 软件 包 还 维护 这 样 的 记录 ， 亦 上 次 
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基准 制定 以 来 ， 一 组 程序 单元 中 哪些 已 经 做 了 修改 。 这 些 功 能 对 于 许多 相关 程序 单元 是 由 不 同 
的 程序 员 开放 的 大 型 软件 系统 来 说 是 非 负 有 用 的 。 

从 小 范围 讲 ， 软 件 开发 包 中 的 编辑 器 通常 根据 正在 使 用 的 程序 设计 语言 进行 定制 。 这 样 的 
网 辑 器 通 种 担 供 目 动 行 缩 进 功能 ， 这 已 成 为 目标 语言 事实 上 的 标准 。 有 了 时， 对 于 关键 和子， 只 要 
程序 员 键入 前 面 少数 几 个 字符 ， 编 辑 器 就 能 够 识别 并 且 上 自动 补 全 。 此 外 ， 编 辑 器 可 以 突出 源 程 
序 中 的 关键 字 〈 也 许 使 用 颜色 )， 使 程序 易 读 。 

在 第 7 章 中 ， 我 们 将 学 到 ， 软 件 开 发 人 员 越 来 越 多 地 研究 这 样 的 方法 ， 用 预制 的 称 为 构件 
的 程序 块 构建 新 的 软件 系统 ， 这 导致 了 一 种 新 的 称 为 构件 架构 的 软件 开发 模型 的 产生 。 基 于 构 
件 架 构 模 型 的 软件 开发 包 通 常 使 用 图 形 接口 ， 在 监视 器 屏幕 上 由 图 标 表 示 各 种 构件 。 在 这 种 环 
境 下 ， 程 序 员 〈 或 者 构件 装配 人 员 ) 用 鼠标 选择 所 需要 的 构件 。 选 好 的 构件 可 以 用 软件 开发 包 
的 编辑 器 进行 定制 ， 然 后 用 鼠标 进行 定位 和 点 击 就 可 以 加 到 其 他 构件 上 。 这 种 软件 包 代表 了 在 
研究 更 好 的 软件 设计 工具 的 方向 上 前 进 了 一 大 步 。 


问题 与 练习 

1. 描述 翻译 过 程 的 3 个 主要 步骤 。 

2. 什么 是 符号 表 ? 

3， 基 于 图 刀 15$ 中 的 语法 图 ， Se 
4. 根据 下 面 的 语法 图 ， 描 述 遵循 语法 结构 Chacha 的 字符 串 ， 
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6.5 ”面向 对 象 程序 设计 


在 6.1 节 中 ， 我 们 看 到 ， 面 癌 对 象 程序 设计 范 型 必然 需要 开发 称 为 对 象 (object) 的 活动 程 
序 单 元 ， 每 一 个 对 象 都 包含 了 描述 对 象 怎 样 响应 各 种 激励 的 过 程 。 一 个 问题 的 面向 对 象 解决 方 
法 鸯 是 标识 出 涉及 的 对 象 ， 并 将 其 作为 一 个 独立 的 单元 来 描述 。 接 着 ， 面 向 对 象 程 序 设 计 语 言 
担 供 了 拉 述 对 象 及 其 行为 的 语句 。 在 本 节 中 ， 我 们 将 引入 一 些 以 C++、Java 和 C#i 语 言 出 现 的 请 
句 ， 这 3 种 语言 都 是 当今 比较 著名 的 面向 对 象 程序 设计 语言 。 


6.5.1 ”类 和 对 象 
我 们 可 以 考虑 开发 一 个 简单 的 计算 机 游戏 的 任务 ， 在 这 个 游戏 中 ， 玩 家 要 通过 高 能 量 激光 
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器 站 从 天 上 掉 下 来 的 流星 进行 射击 来 保卫 地 球 。 每 个 激光 器 都 有 一 定 的 内 部 能 量 源 ， 而 每 一 次 
射击 将 消耗 一 部 分 能 量 。 一 旦 能 量 用 尽 ， 激 光 就 失去 了 作用 。 每 一 个 激光 器 应 该 能 响应 瞄准 右 
面 一 点、 瞄准 左面 一 点 或 点 火 发 射 激光 东 的 命令 。 

在 面向 对 象 范 型 中 ， 计算 机 游戏 中 的 每 一 束 激光 都 作为 一 个 对 象 来 实现 ， 每 个 这 样 的 对 象 
部 包含 了 它 的 剩余 能 量 的 记录 以 及 修改 目标 和 发 射 激 光束 的 过 程 ， 是 然 所 有 的 激光 对 象 都 有 同 
桩 的 属性 ， 它 们 可 以 使 用 一 个 公用 模板 来 构建 。 在 面向 对 象 范 型 中 ， 这 样 的 一 组 对 象 的 模板 称 

作 类 〔《class )。 

在 第 8 章 我 们 将 探究 类 和 数据 类 型 之 间 的 相似 点 。 现 在 ， 我 们 先 简单 地 说 类 描述 的 是 一 组 
对 象 的 共同 特征 ， 这 与 基本 数据 类 型 整 型 的 概念 包含 像 数 字 1、5 和 82 这 样 的 数 的 一 般 特 征 类 
似 。 一 旦 程序 员 在 程序 里 面包 含 一 个 类 的 描述 ， 那个 模板 可 以 用 来 构建 和 操作 对 象 ， 这 相当 于 
基本 的 整 型 允许 操作 整 型 的 “对 象 "。 

在 C++、Java 和 C# 语 言 中， 类 使 用 下 列 形式 的 语句 来 描述 ， 

Class Name 


{ 


} 
其 中 ，Name 是 一 个 名 字 ， 在 程序 的 其 他 地 方 可 通过 这 个 名 字 来 引用 该 类 。 括号 中 的 是 被 描述 的 
类 的 属性 。 图 6-19 特 别 展 示 了 描述 计算 机 游戏 中 激光 结构 的 是 名 为 Laserclass 的 类 。 这 个 类 包 
会 1 个 名 字 为 RemainingPower 的 整 型 变量 以 及 3 个 名 字 分 别 为 urnRight、 EurnDeftt 和 和 fire 
的 过 程 的 声明 ， 这 些 过 程 描述 了 完成 相应 动作 的 执行 步骤 。 因 此 ， 任何 一 个 从 该 模板 构建 的 对 
象 都 包含 如 下 特性 : 1 个 名 字 为 RemainingPower 的 变量 以 及 3 个 名 字 分 别 为 turnRicht、 
EurnDett 和 fire 的 过 程 。 


尼 冲 急 瑟 工 避 号 起 上 三 ] 局 所 局 


{ 工 避 tt 失 人 Ia minSPower = 100: 


~ 保留 在 每 个 该 类 型 对 


void EurnRight (  ) 象 里 的 数据 的 描述 
0 

Ma 描述 该 类 型 对 象 应 该 如 
何 应 对 各 种 消息 的 方法 


VC1LQG 下 计 王 全 《 ) 


和 
= 


图 6-19 ”描述 计算 机 游戏 中 一 种 激光 武器 的 类 结构 


对 象 内 部 的 变量 ， 例 如 RemainingPower， 称 为 实例 变量 (instance variable)， 而 在 对 象 里 
的 过 程 称 为 方法 (method)〈 对 于 C++ 来 说 称 作成 员 函 数 )。 注 意 ， 在 图 6.19 中 ， 实例 变量 
RemainingPower 使 用 关 似 于 在 6.2 节 中 的 声明 语句 来 描述 ， 而 方法 使 用 63 节 中 的 函数 或 者 
过 程 的 方式 来 描述 。 实 例 变 量 的 声 明和 方法 的 描述 是 最 基本 的 命令 型 程序 设计 的 概念 。 
一 且 在 我 们 的 游戏 程序 中 描述 了 类 LaserClass， 我 们 就 可 以 声明 3 个 Laserclass “类 
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型 ”的 变量 Lasger1、Laser2、Laser3， 这 是 通过 语句 


LaSerclasSs LaseLrlL，LaSserza，LaSser3 


来 实现 的 。 注 意 ， 这 与 我 们 在 6.2 节 中 所 学 的 声明 3 个 整 型 变量 x、y 和 z 的 语 名 


1mnt 其 YY，Z; 


的 格式 是 一 样 的 。 它 们 都 包括 了 一 个 类 型 名 ， 以 及 出 现在 类 型 名 后 的 将 要 声明 的 变量 列表 。 二 
者 都 由 变量 名 后 面 跟着 将 要 声明 的 一 系列 变量 组 成 。 区 别 在 于 ， 后 者 所 说 的 变量 xy 和 2 在 程序 
中 用 来 指向 一 个 整 型 项 〈 基 本 类 型 )， 而 前 者 所 说 的 变量 Laser1、Laser2 和 Laser3 在 程序 中 
用 来 指 回 一 个 LaserCclass“ 类 型 ”的 项 〈 这 是 在 程序 中 自己 定义 的 “类 型 沪 。 

一 旦 我 们 声明 了 Daserclass“ 类 型 ”的 变量 Laser1、Laser2 和 Laser3， 就 可 以 给 它 
们 赋值 。 在 这 种 情况 下 ， 所 赋 的 值 必须 是 与 Laserclass 类 型 相 一 致 的 对 象 。 这 些 赋 值 可 以 通 
过 赋值 语句 来 进行 ， 但 是 ， 在 声明 变量 时 ,在 同一 个 声明 语句 内 给 变量 赋 初 值 通常 是 很 方便 的 。 
在 C++ 语言 中 的 声明 中 ， 这 种 初始 赋值 是 自动 的 。 也 就 是 说 ， 语 名 


LaSeTrClLass Daser]l，Laser2 ，Laser3 ， 


不 仅 创 建 了 变量 Laser1、Laser2 和 Laser3， 而 且 还 创建 了 3 个 Laserclass “类 型 ”的 对 象 ， 
其 中 一 个 作为 每 个 变量 的 值 。 在 Java 和 C# 中 ， 这 种 初始 赋值 与 对 一 个 基本 类 型 变量 赋 初 值 的 方 
法 基本 相同 。 特 别 是 ， 鉴 于 语 铝 


1nt X=3; 


不 仅 声明 了 一 个 整 型 变量 x， 同 时 还 为 这 个 新 的 变量 赋值 为 3， 语 名 


LaSercClaSsSs LaSserl = mew LaserClass() 


不 仅 声明 了 一 个 LaserClass“ 类 型 ”的 变量 Laser1， 而 且 还 通过 使 用 Laserclass 类 模板 创 
建 了 一 个 新 的 对 象 ， 并 且 将 其 作为 初 值 赋 给 Laser1l。 

在 进一步 讨论 之 前 ， 我 们 应 该 强调 一 下 类 和 对 象 之 间 的 区 别 。 类 是 一 个 模板 ， 对 和 象 是 由 
这 个 模板 创建 出 来 的 。 一 个 类 能 够 用 来 创建 许多 个 对 象 ， 我 们 经 常 将 对 象 称 为 类 的 实例 
(instance)。 因 此 ， 在 我 们 的 计算 机 游戏 中 ，Laser1l1、Daser2 和 Laset3 都 是 LaserCclagsg 
类 的 实例 。 

在 用 声明 语句 创建 对 象 并 且 将 其 赋 给 变量 Laser1l、Laser2、Laser3 之 后 ， 可 以 通过 
编写 命令 语句 来 激活 这 些 对 象 〈 按 面向 对 象 术语 来 说 ， 这 被 称 为 “向 对 象 发 送 消息 ”) 中 合 
适 的 方法 , 我 们 就 可 以 继续 游戏 编程 。 具体 而 言 , 我 们 可 用 Laseril 通过 以 下 语句 执行 fire 
方法 : 

Laserl.fire(l); 

或 者 ， 我 们 可 让 Laser2 执 行 它 的 turnLeft 方 法 ， 这 是 通过 语句 


LaSser2 。 turnLett () ; 


来 实现 的 。 这些 实 际 上 是 过 程 的 调用 。 的 确 ， 前 面 一 个 语句 是 调用 赋 给 变量 Laser1 的 对 象 内 部 
的 过 程 〈 方 法 ) fire， 后 者 则 是 调用 赋 给 变量 Laser2 的 对 象 内 部 的 过 程 turnLeft。 

在 这 个 阶段 ， 流 星 游 戏 例 子 已 经 给 出 了 掌握 典型 面向 对 象 程序 总 体 结构 的 背景 知识 〈 图 
6-20)。 和 它 包含 了 与 图 6-19 相 似 的 一 系列 类 的 描述 ， 每 一 个 都 描述 了 程序 中 使 用 的 一 个 或 多 个 对 
象 的 结构 。 另 外 ， 程 序 会 包含 一 个 命令 程序 段 (通常 和 名 字 “main” 有 关 )， 这 个 命令 程序 段 包 
括 了 当 程 序 运 行 时 最 初 要 执行 的 步骤 序列 。 这 个 段 包 括 与 我 们 激光 类 的 声明 类 似 的 声明 语句 ， 
用 来 建立 程序 中 使 用 的 对 象 ， 还 包括 调用 那些 对 象 中 执行 方法 的 命令 语句 。 
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程序 

过 程 单元 【〈 常 称 为 main)， 它 
指示 对 象 的 构 遗 并 对 它们 的 
方法 做 出 台 适 的 调用 


类 描述 





图 6-20 ”典型 的 面向 对 象 程 序 结构 


6.5.2 构造 器 


当 构 造 对 象 时 ， 通 常 需要 进行 一 些 个 性 化 的 定制 。 例 如 ， 在 我 们 的 电脑 游戏 中 ， 有 可 能 需 
要 实现 一 些 具 有 不 同 初始 能 量 设置 的 激光 器 ， 这 就 意味 着 ， 不 同 对 象 中 的 RemainingPower 实 
例 变量 应 该 给 定 不 同 的 初始 值 。 这 种 初始 化 通过 定义 特殊 的 方法 -一 - 称 作 构造 器 〈constmctor) 
来 进行 ， 它 是 在 构建 类 的 对 象 时 自动 执行 的 。 一 个 构造 器 在 类 的 对 象 中 是 通过 使 它 的 名 字 与 类 
的 名 字 相 同 来 标识 的 。 

图 6-21 给 出 了 图 6-19 中 的 raserclass 类 的 扩展 定义 。 注 意 ， 它 包括 一 个 构造 器 ， 该 构造 器 的 
形式 是 名 为 LaserClass 的 方法 。 这 个 方法 将 它 接受 的 参数 值 赋 给 实例 变量 Remaining- POWeI。 
因此 ， 当 一 个 对 象 在 类 中 构建 出 来 时 ， 这 个 方法 就 会 执行 ， 使 得 RemainingPower 被 初始 化 为 
一 个 合适 的 值 。 






寺 一 小 对 象 被 创建 时 ， 


斧 外 站 三 二 工 电 号 让 工 性 本 忆 生生 3 Se 

| 爸 造 器 给 Remainmi 广 可 =- 
〖 1 二 - - 首 一 四 本 
LE 了 工 们 上 上 及 候 放 二 1】 瓦工 咯 可 屯 OWET ; Power 赋 一 个 值 


| 瑟 六 生生 下 性 二 癌 操 雪 - 工科 于 虐 如 荆 蕊 erwre 工 
( -RemalningpPower =: TitialPpower， 
】 
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图 6-21 带 有 构造 器 的 类 
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构造 器 所 使 用 的 实 参 是 由 引起 构建 该 对 象 的 语句 里 的 参数 标识 的 。 因 此 ， 基 于 图 6-21 中 给 
出 的 类 的 定义 ，C++ 程 序 员 将 会 编写 语句 

LaserClasSs Laserl1(50) ，Laser2 (1001 
来 创建 两 个 LaserClass 的 对 象 ， 一 个 是 Daser1l 1， 初 始 能 量 值 S0;， 另 一 个 是 Laser2， 初 始 
能 量 值 100。 在 Java 和 C# 的 程序 员 完 成 同样 工作 的 语句 是 


卫 总 号 息 工 尼 二 总 号 局“ 工 站 避 和 开工 三 症 生 W 工 羡 哩 已 TC 荆 二 号 号 15) ， 
TaserClass Daser2 = mew LaserClassl(I100) : 
6.5.3 附加 特性 


假设 我 们 需要 改进 游戏 ， 以 使 得 玩家 达到 一 定 的 分 数 时 ， 可 以 奖励 他 们 为 现 有 的 激光 器 补 
序 能 量 。 除 了 和 它们 可 以 补充 能 量 以 外 ， 这 些 激 光 器 与 其 他 激光 器 有 同样 的 属性 。 

为 了 简化 对 类 似 但 不 完全 相同 的 对 象 的 描述 ， 面 向 对 象 语 言 多 许 一 个 类 通过 称 为 继承 
(inheritance) 的 方法 包含 其 他 类 的 属性 。 例 如 ， 假 设 使 用 Java 来 开发 我 们 的 游戏 程序 ， 我 们 
首先 使 用 类 的 语句 来 描述 前 面 定 义 的 类 Laserclass， 这 个 类 摘 述 了 程序 中 的 所 有 激光 器 的 共 
同属 性 。 我 们 使 用 语句 

己 ] 总 与 呈 ”及 息 扬 上 忆 工 可 局 电 匠 ] 忆 DB 有 BT 己基 七 扣 们 避 S 荆 辟 马 三 和】 六 号 号 


} 


来 描述 另 一 个 类 RechargeableLaser。(C++ 和 C# 语 言 用 冒号 来 代替 extends。) 这 里 extends 
指明 了 这 个 类 不 仅 继承 了 类 Laserclass 的 特性 ， 同 时 还 包含 了 括号 中 出 现 的 特性 。 括 号 可 以 
包 合 新 的 方法 〈 名 字 也 许 是 recharge)， 它 描述 急 始 化 实例 变量 RechargeableLaser 的 过 程 。 
一 旦 类 定义 好 了 ， 就 可 以 使 用 语句 


工 总 号 它 工 伺 二 志 号 号 卫 己 吕 马 工 工 ， 了 工 忌 号 司 T 


来 将 变量 Laser1 和 Laser2 声 明 为 原来 的 激光 器 的 变量 ， 并 且 使 用 语句 
RechargeableLaSeTr TaSser3，Daserd; 


来 将 变量 Laser3 和 Laser4 声 明 为 拥有 类 RechargeableLaser 中 描述 的 额外 特性 的 激光 器 
变量 。 
继承 的 使 用 导致 各 种 相似 但 是 不 同 的 对 象 的 存在 ， 也 导致 了 在 6.2 节 中 讨论 的 重 载 的 现象 。 
让 我 们 回忆 一 下 , 重 载 是 使 用 一 个 诸如 + 的 符号 , 根据 操作 数 类 型 的 不 同 ,代表 了 不 同 的 操作 。) 
假设 一 个 面向 对 象 的 图 形 开 发 包 包含 各 种 对 象 ， 每 一 个 都 代表 了 一 种 形状 〈 圆 形 、 抢 形 、 三 角 
形 等 )。 一 个 特定 的 图 像 由 一 组 这 类 对 象 构成 。 每 个 对 象 都 有 自己 的 大 小 、 位 置 和 颜色 ， 都 有 自 
己 啊 应 消 县 的 方式 ， 例 如 ， 移 动 到 一 个 新 的 位 置 ， 或 者 在 屏幕 上 画 出 自己 。 我 们 仅仅 对 图 形 中 
的 每 个 对 象 发 送 “ 画 自己 ”的 消息 来 画图 。 但 是 ， 对 象形 状 的 不 同 决定 了 所 使 用 的 画 一 个 对 象 
的 例 程 是 未 同 的 修正 方形 的 画 法 和 圆 形 的 画 法 是 不 同 的 。 这 种 个 性 化 的 定制 消息 的 解释 
称 为 甸 态 〈polymorphism)， 这 种 消息 是 多 态 的 。 
封装 (encapsulation) 是 与 面向 对 象 程序 设计 相关 的 另 一 个 特性 ， 它 是 指 限制 对 一 个 对 象 内 
部 属性 的 访问 。 说 一 个 对 象 的 特定 属性 是 封装 的 ， 就 意味 着 只 有 对 象 自 己 才 可 以 访问 它们 。 被 
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封 效 的 属性 被 称 为 私有 属性 ， 而 可 以 从 对 象 外 部 访问 到 的 属性 称 之 为 公有 属性 。 
例如 , 让 我 们 回 到 图 6-19 中 的 Daserclass 类 。 它 描述 了 一 个 实例 变量 ReInaa II Dn5PeweTL 


以 及 3 个 方法 turnRight、turnLeftt 和 fire。 这 些 方法 可 以 被 其 他 程序 单元 访问 ， 并 且 可 


以 对 LaserClass 的 实例 执行 合适 的 动作 。 但 是 有 关 对 RemalnlLnoPowerI 值 的 修改 应 当 只 能 
由 实例 内 部 方法 来 实现 ， 其 他 程序 单元 不 能 够 直接 访问 这 个 值 。 为 了 强调 这 一 点 ， 如 图 6-22 所 
示 ， 我 们 需要 指定 RemainingPower 为 一 个 私有 变量 而 其 他 3 个 方法 都 是 公有 的 。 通 过 这 种 设 
计 , 在 程序 编译 期 间 任何 试图 从 对 象 的 外 部 对 RemainingPower 的 值 进行 访问 的 操作 都 会 被 标 
识 为 错误 ， 并 要 求 程序 员 改 正 该 错误 。 


= 业 亲 记号 世 志 息 记 王 扫 二 总 所 名 


Fwatel int RemainingPower， 
关中 的 成 分 定义 为 公有 或 
是 私有 依赖 于 是 否 要 从 其 风 -一 EUaci LaserClass (InitialPower| 
程序 单元 访问 它 
他 程序 下 元 访问 它们 { 及 全 而 吉 工 记 工 各 PCOwer = 工 闪 1 在 工 电 ] 忆 已 傅 导 蕊 ， 


] 
ESURESI VCOiG turnRiabht | 


由 sswe }】 


RU void turnLett | 


和 


ES void Fire | 


t 。.*。 】 





图 6-22 ”在 Java 和 C# 中 使 用 封装 的 Lasserclass 的 定义 


问题 己 练 习 

. 对 粤 和 关 之 间 的 区 别 是 什么 ? 

2. 在 本 节 的 计算 机 游戏 中 ， 除 了 LaserClass， 还 可 以 找到 什么 类 的 对 象 ?除了 RemaininoPower， 还 
有 什么 样 的 实例 变量 应 该 出 现在 Laserclass 类 中 ? 

， 假设 关 PartTimeEmployee 和 PullTimeEmployee 继 承 了 类 Emplovee 的 属性 .你 可 以 想到 这 两 个 
关中 都 有 什么 特性 ? 

4. 什么 是 构造 器 ? 

5 为 什么 类 中 的 一 些 项 要 设计 为 私有 的 ? 


[ 
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假设 我 们 要 为 多 路 攻击 敌人 飞船 的 计算 机 游戏 设计 一 个 生成 动画 的 程序 。 一 个 处 理 方 法 就 
是 只 设计 一 个 程序 ， 用 该 程序 来 控制 整个 动画 屏幕 。 这 种 程序 将 负责 绘制 每 一 个 飞船 〈《 假 设 动 
于 做 得 很 遏 真 )， 这 意味 着 该 程序 将 必须 掌握 许多 飞船 的 各 自 特 征 。 为 一 种 方法 就 是 设计 一 个 控 
制程 序 来 控制 单个 飞船 的 动画 ， 每 个 飞船 的 特征 由 参数 决定 ， 在 程序 执行 的 开始 阶段 给 参数 赋 
值 。 然 后 ， 动 画 可 以 通过 创建 这 个 程序 的 多 个 激活 〈activation ) 来 构建 ， 每 一 次 激活 都 使 用 各 
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目的 一 组 参数 。 同 时 执行 这 些 动画 ， 我 们 就 会 得 到 有 许多 飞船 从 屏幕 上 同时 飞 过 的 假象 。 

这 种 多 个 激活 的 同时 执行 称 为 并 行 处 理 (parallel processing ) 或 并 发 处 理 〈concurrent 
processing)。 真 正 的 并 行 处 理 需 要 多 个 CPU， 每 个 CPU 都 执行 一 个 激活 。 当 仅 有 一 个 CPU 可 
用 时 ,并行 处 理 给 我 们 的 错觉 是 允许 多 个 激活 分 享 一 个 CPU 的 时 间 ， 其 方式 与 通过 多 道 程序 设 
寺 操 作 系统 来 执行 相似 〈 参 见 第 3 章 )。 

许多 现代 计算 机 应 用 程序 在 并 行 处 理 环境 里 解决 要 比 在 单 指令 序列 环境 里 更 容易 实现 。 于 
十 ， 较 新 的 程序 设计 语言 提供 了 表达 并 行 计算 所 涉及 的 语义 结构 的 语法 。 这 种 语言 的 设计 需要 
对 这 些 语义 结构 的 识别 以 及 描述 它们 的 语法 的 开发 。 

每 一 种 程序 设计 语言 都 试图 从 自己 的 角度 来 处 理 并 行 处 理 范 型 ， 结 果 产 生 了 不 同 的 术 
语 。 例 如 ,“ 诉 活 ” 这 个 非 正 式 的 称谓 ， 在 Ada 语言 中 称 为 任务 (task)， 而 在 Java 中 称 为 
线程 〈thread)。 这 就 是 说 ， 在 Ada 程序 中 ， 同 时 发 生 的 动作 是 通过 创建 多 个 任务 来 执行 的 ， 
而 在 Java 程序 中 ， 是 通过 创建 多 个 线程 来 执行 的 。 在 这 两 种 情况 下 ， 结 果 都 是 多 个 激活 被 
生成 和 执行 ， 其 方式 与 多 任务 操作 系统 控制 下 的 进程 是 一 样 的 。 我 们 将 采用 Java 中 的 术语 ， 
把 这 种 “进程 ”都 称 为 线程 。 

也 许 ， 在 涉及 并 行 处 理 的 程序 中 必须 表达 的 大 多 数 最 基本 动作 就 是 创建 新 的 线程 。 如 果 希 
望 可 以 同时 执行 飞船 程序 的 多 个 激活 ， 那 么 就 需要 说 明 这 一 点 的 语法 。 这 种 产生 新 的 线程 的 处 
理 方 法 通 疝 是 与 请 求 一 个 传统 的 过 程 的 执行 类 似 。 不 同 之 处 在 于 ， 在 传统 的 程序 中 ， 请 求 过 程 
激活 的 程序 单元 在 所 请 求 的 过 程 终止 之 前 不 再 往 下 执行 了 《〈 回 想 图 6-8)， 而 在 并 行程 序 中 ， 请 
求 程序 单元 在 请 求 过 程 执行 任务 的 同时 继续 向 下 执行 (图 6-23)。 因 此 ， 要 创建 多 个 飞船 飞 过 屏 
荐 ， 我 们 可 以 写 一 个 主 程序 ， 该 主 程序 只 生成 多 个 飞船 程序 的 激活 ， 每 个 激活 都 提供 了 描述 不 
同 飞 船 特征 的 参数 。 

调用 程序 单元 


过 程 被 激活 


时 、、、 两 人 程序 单 -大 
元 同步 执行 


齐 





图 6-23 ”产生 线程 


一 个 与 并行 处 理 相关 的 更 复杂 的 问题 就 是 处 理 线程 之 间 的 通信 。 例 如 ， 在 飞船 例子 中 ， 代 
夫 不 同 飞船 的 线程 可 能 需要 相互 之 间 通 告 它们 的 方位 以 协调 行动 。 在 某 些 情况 中 ， 一 个 线程 需 
要 等 待 ， 直 到 另 一 个 线程 到 达 了 它 计 算 中 的 某 个 位 置 ， 或 者 一 个 线程 在 实现 特定 的 任务 之 前 需 
要 停止 丸 一 个 线程 。 

长 期 以 来 ， 这 种 通信 需求 一 直 是 计算 机 科学 家 研究 的 课题 ， 并 且 许多 新 的 程序 设计 语言 都 
有 不 同 的 线程 之 间 交 互 的 问题 。 例 如 ,考虑 当 两 个 线程 操作 同一 个 数据 时 面临 的 通信 问题 。( 这 
个 例子 在 3.4 节 更 详细 地 进行 了 描述 。) 如 果 同 时 执行 的 两 个 线程 都 需要 给 一 个 公用 的 数据 项 加 
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3， 需要 一 个 方法 来 保证 在 允许 一 个 线程 执行 它 的 任务 之 前 允许 另 一 个 线程 完成 它 的 任务 ， 否则 
它们 会 使 用 相同 初始 值 开始 各 自 的 计算 ， 这 将 意味 着 最 后 的 结果 将 会 是 加 3 而 不 是 加 6。 一 次 
上 只 能 由 一 个 线程 访问 的 数据 称 为 互 斥 访问 。 

一 种 实现 互 斥 存 取 的 方法 就 是 编写 描述 所 涉及 线程 的 程序 单元 ， 以 便 在 一 个 线程 正在 使 用 
共享 数据 时 ， 它 可 以 阻止 其 他 线程 访问 这 个 数据 ， 直到 这 样 的 访问 是 安全 的 。( 这 个 方法 在 34 
节 中 已 经 描述 过 ， 在 那里 我 们 把 一 个 进程 中 访问 共享 数据 的 那 部 分 标识 为 临界 区 .) 经 验 表 明 ， 
这 个 方法 是 有 缺陷 的 ， 它 把 保证 互 斥 的 任务 分 散在 程序 各 处 每 个 访问 该 数据 的 程序 单元 都 
必须 正确 设计 以 确保 这 种 互 斥 ， 因 此 ， 一 个 程序 段 中 的 错误 就 能 使 整个 系统 贿 溃 。 因 此 ， 许 多 
人 认为 一 个 更 好 的 解决 办 法 是 使 数据 有 可 以 控制 对 自身 的 访问 的 能 力 。 简 而 言 之 ， 不 再 依赖 于 
访问 数据 进程 来 防止 多 重 访问 ， 而 是 赋予 数 据 本 身 这 个 能 力 ， 结 果 是 访问 控制 集中 于 程序 中 的 
一 个 点 ， 而 不 是 分 散 于 许多 程序 单元 中 。 增 加 了 对 自身 访问 的 控制 能 力 的 数据 项 称 作 监 控 程 序 
《monjitor) 。 

我 们 看 到 ， 程序 设计 语言 中 对 于 并 行 处 理 的 设计 包括 了 开发 表达 诸如 线程 的 创建 、 线程 的 
暂停 和 重启 、 临 界 区 的 标识 以 及 监控 程序 的 组 成 等 方法 。 

在 结束 本 节 时 ， 我 们 应 当 注 意 ， 尽管 动画 提供 了 一 个 探索 并 行 计算 问题 的 有 趣 场 量 ， 但 是 
这 仅仅 是 从 并 行 处 理 技术 中 受益 的 许多 领域 中 的 一 个 。 天 气 预 报 、 空 中 交通 管制 、 复 杂 系 统 ( 从 
核反应 到 行人 的 交通 ) 的 模拟 、 计算 机 网 络 以 及 数据 库 的 维护 都 是 可 以 应 用 这 项 技术 的 领域 ， 





器 题 与 练习 

E. 可 以 进行 并 发 处 理 的 程序 设计 语言 有 哪些 特性 是 传统 语言 中 没有 的 ? 
2 描述 两 种 可 以 确保 对 数据 豆 斥 访问 的 方法 ? 

3. 驮 证 在 除了 动画 以 外 的 其 他 环境 中 并 行 计算 的 好 处 。 
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在 6.1 节 ， 我 们 断言 ， 形 式 逻 辑 提供 了 一 个 通用 的 解决 问题 的 算法 ， 玮 名 这 个 算法 ， 可 以 
爸 建 一 个 说 明 性 程序 设计 系统 。 在 本 节 中 ， 我 们 将 研究 这 个 断言 ， 肯 先 介绍 这 个 算法 的 基本 原 
理 ， 然 后 再 简要 地 看 一 看 基于 这 种 算法 的 说 明 性 程序 设计 语言 。 


6.7.1 逻辑 推演 


假设 我 们 知道 Kermit 要 人 么 病 了 要 么 就 在 舞台 上 ， 并 且 我 们 被 告知 Kermit 不 在 舞台 上 ， 我 
们 束 可 以 推断 出 Kermit 一 定 是 病 了 。 这 个 演绎 推论 的 例 子 称 为 消解 〈resolution )。 消 解 是 一 种 
称 为 推理 法 则 (〈inference rule) 的 许多 技法 之 一 ， 可 以 用 来 从 大 量 的 陈述 中 推导 出 结果 。 

为 了 更 好 地 理解 消解 ， 我 们 首先 可 以 用 单个 字母 表示 简单 命题 ， 通 过 符号 一 来 表示 命题 的 
台 定 。 例 如 ， 我 们 用 4 来 代替 “Kermit 是 一 个 王子 ” 用 吾 来 代替 “Piggy 小 姐 是 一 个 演员 ” 
那么 ， 表 达 式 

上 OOR 万 
意味 着 Kermit 是 一 个 王子 或 者 Piggy 小 姐 是 一 个 演员 六 而 

已 AND 一 4 
意味 着 Piggy 小 姐 是 一 个 演员 而 Kermit 不 是 一 个 王子 ” 我 们 将 用 箭头 来 表示 列 涵 关系 。 例 如 ， 
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表达 式 

贞 一 旦 
意味 着 “如 果 Kermit 是 一 个 王子 ，Piggy 小 姐 就 是 一 个 演员 ?”。 

以 这 种 通 式 ， 消 解 原理 意味 着 从 命题 

忆 OR 吕 
和 

R OR 一 @ 
可 以 归结 出 命题 

POOR 民 
这 样 ， 我 们 就 说 ， 原 来 两 个 命题 销 解 形成 了 第 三 个 命题 ， 我 们 称 之 为 消解 式 (resolvent)。 重 要 
的 是 要 看 到 ， 这 个 消解 式 是 原始 命题 的 逻辑 结论 。 这 就 是 说 ， 如 果 原 始 命题 是 真 的 ， 那 么 消解 式 
也 一 定 是 真 的 。( 如 果 @ 是 真 的 ， 那 么 R 一 定 是 真 的 ; 但 是 如 果 @ 是 假 的 ， 那 么 忆 一 定 是 真 的 。 因 此 ， 
不 管 如 是 真是 假 ，P 或 者 尺 一 定 是 真 的 。) 

如 图 6-24 所 示 ， 我 们 用 图 形 化 的 方法 表示 了 这 两 个 命题 的 消解 ， 在 这 个 图 中 ， 原 始 命题 的 
连 线 指向 下 面 的 消解 式 。 注意 , 消解 只 能 用 于 成 对 命题 ,并且 这 些 命题 以 子 名 形式 (clause form ) 
出 现 一 一 也 就 是 说 ， 它 们 是 通过 布尔 运算 符 OR 连接 起 来 的 。 因 此 


POOR 开口 R 一 疙 


ee 


户 人 R 天 


图 6-24 ”消解 命题 (PORQC) 和 (ROR 一 CC) 推出 CPOR 届 ) 

POR OO 
是 子 句 形式 ， 而 

PP 一 如 
就 不 是 子 句 形 式 。 这 对 于 我 们 来 说 不 是 很 重要 ， 因 为 这 是 数理 逻辑 中 的 一 个 定理 的 推导 结果 ， 这 个 
定理 说 ， 任 何以 一 阶 谓词 远 辑 〈 一 个 用 扩充 的 表达 能 力 表 示 语 句 的 系统 ) 表达 的 语句 都 可 以 用 子 句 
形式 来 表达 。 我 们 不 在 这 里 进一步 探讨 这 个 重要 的 定理 ， 但 是 为 了 今后 的 使 用 ， 我 们 发 现 命题 

站 
等 价 于 

OOR 一 书 

如 果 一 组 命题 中 的 所 有 命题 不 同时 为 真 ， 那 么 这 组 命题 就 称 为 不 相 容 的 《inconsistent)。 换 
句 话 说 ， 一 组 不 相 容 的 命题 是 一 组 包含 目 相 韦 盾 的 命题 。 一 个 简单 的 例子 是 命题 与 命题 一 户 的 
组 合 。 还 辑 学 家 已 经 证 明 ， 重 复 的 消解 提供 了 验证 一 个 不 相 容 子 句 的 集合 的 不 相 容 性 的 系统 化 


方法 。 这 个 方法 就 是 ， 如 果 反 复 进行 消解 而 产生 了 一 个 空子 句 《〈 消 解 命题 PP 和 命题 一 P 的 结果 )， 
那么 原来 的 一 组 命题 必定 是 不 相 容 的 。 例 如 ， 图 6-25 证 明 命题 集合 


PORO 有 ROR-O 一 R 一 PP 
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Bl13] 是 不 相 容 的 。 


[ 


假定 我 们 要 证 明 一 组 命 古 草 涵 了 命题 P。 推 导 这 EGRD RONRSC 本 - 光 胆 
个 命题 忆 就 相当 于 对 命题 一 P 取 反 。 因 此 ， 我 们 所 需 下、 / 7 / 
要 做 的 就 是 将 原来 的 命题 与 一 P 进行 消解 ， 直 到 产生 RORR / 
一 个 空子 句 。 基 于 获得 的 空子 句 ， 我 们 就 可 以 说 _ 忆 ， 
与 原来 的 命 昕 组 是 不 相 容 的 ， 从 而 可 以 推导 出 原来 的 
一 组 命题 一 定理 涵 P。 NA / 

在 将 消解 应 用 于 一 个 实际 的 程序 设计 环境 之 前 ， 信子 名 
还 有 最 后 一 个 问题 。 假 设 我 们 有 两 个 命题 

图 6-25 ”消解 命题 (POR O) 、 

(MarY 183 at 天 ) 一 (Mary's 1Lamb 1s at 区) (ROR-O) 、-R 和 一 P 
其 中 X 代 表 任 何 地 方 ， 并 且 

Mary 1S at Phome 
按照 子 句 形式 ， 两 个 命题 变 为 

(MarYy"s Lamb is at XI) OOR 一 (Mary 1S at 三 ) 
以 及 

(Marvw is at home) 

和 一 看 ， 似 乎 没有 可 以 消解 的 元 素 。 另 一 方面 ， 包庇 〈《Mary is at home) 和 一 (Mary is 
at X) 近 于 相互 对 立 。 问 题 是 要 认识 到 ， 命 题 Marvy is at X 是 一 个 关于 位 置 的 通用 命题 ， 而 
关于 home 的 命题 则 是 它 的 特殊 形式 。 因 此 ， 对 于 第 一 个 命题 的 特殊 情况 是 ; 

(MarY 'S 1armb is at home)OR 一 (Mary is ar home) 
它 可 以 与 命题 

(MarzyY 1B 引起 home') 
消解 产生 命题 

(Mary'Ss lanmb is at home] 
把 值 赋 给 变量 〈 例 如 将 home 赋 给 x)， 从 而 使 得 消解 可 以 进行 的 过 程 称 为 单一 化 〈unification )， 
这 个 过 程 使 得 演绎 系统 中 一 般 的 命 原 可 以 用 于 特定 的 应 用 。 


6.7.2 Prolog 


程序 设计 语言 Prolog (PROgramming in LOGic 的 缩写 ) 定 一 个 说 明 性 程序 设计 语言 ， 它 解决 
问题 的 基本 算法 就 是 反复 地 进行 消解 。 这 样 的 语言 称 为 远 辑 程序 设计 (logic programming) 语言 。 
一 个 Prolog 程序 由 一 组 初始 语句 组 成 ， 基 本 的 算法 在 它们 之 上 进行 演绎 推理 。 构成 这 些 语句 的 成 
分 称 为 谓词 (predicate )。 一 个 谓词 由 一 个 标识 符 和 一 个 带 括号 的 语句 组 成 ， 括号 里 列 有 该 谓词 的 
要 元 。 谓 词 代表 了 与 它 的 变 元 相关 的 事实 ， 因 而 ， 博 词 标识 符 的 选取 通常 都 反映 该 事实 的 基本 语 
义 。 因 此 ， 如 果 我 们 希望 表达 B 训 是 Mary 的 家 长 ， 我 们 可 以 使 用 这 样 的 谓词 形式 

Parent (Pil1，mary |) 

注意 ， 尽 管 这 个 谓词 里 的 变 元 表示 正常 的 名 字 ， 但 是 它们 是 以 小 写字 母 开 始 ， 这 是 因为 
Frolog 区 分 毅 量 和 变量 的 方法 是 常量 是 以 小 写字 母 开 始 ， 而 变量 是 以 大 写字 母 开 始 。( 这 里 ， 我 
们 已 经 用 了 Prolog 的 专 有 名 词 ， 用 术语 常量 〈constant) 代替 更 通用 的 术语 字面 量 (literal)。 更 
准确 一 点 讲 ， 在 Prolog 里 ， 用 名 词 bil1 《注意 是 小 写 ) 圾 示 的 字面 量 可 能 会 被 用 更 通用 的 表示 
法 表示 Bil1， 和 名词 Bil1 (注意 是 大 写 ) 表示 为 变量 。) 
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一 个 Prolog 程序 中 的 语句 有 事实 和 规则 两 种 ， 每 个 都 是 以 一 个 句点 来 结束 。 一 个 事实 包括 
一 个 句点 。 例 如， 乌龟 比 蜗牛 快 这 个 事实 用 Prolog 语句 可 以 这 样 来 描述 ， 

芭 号 七 全 IT (tuUztJ 全 ， Snal1l) ， 
而 兔子 比 马 龟 快 的 事实 可 以 这 样 来 表示 ， 

上 aaStez (abblit，t 上 urt1le) ， 


一 个 Prolog 规则 是 一 个 曹 池 语句。 但 是 ，Prolog 程序 员 并 不 是 将 语句 写成 像 世 = 了 这样， 
而 是 写成 “Y 这 X” 这 样 ， 除 非 使 用 符号 :-〈 一 个 冒号 和 一 个 连 字 符 ) 来 替代 符号 证。 因此 规则 
“基因 old implies Xis wise” 对 于 一 个 还 辑 学 家 来 说 要 这 样 来 表述 ; 

口 J 电 (X) 一 W1Se( 基 ) 
而 在 Prolog 语 言 里 表示 为 : 

W1ILSeIX):- Da9I(X) . 
又 如 ， 规 则 


【于 已 St er (其 ，Y) AND 荆 aster(Y，Z) ) 一 上 aster(X，Z) 


在 Prolog 里 表达 为 

tasteri(X，Z):- aster(X，Y) ,faster(tY，2) ， 

这 个 分 隔 faster (X,Y) 和 faster (X,Y) 的 逗号 代表 合 取 符 AND。 尽 管 这 样 的 规则 不 是 子 
名 形式 ， 但 是 它们 在 Prolog 里 是 允许 的 ， 因 为 它们 很 容易 转化 为 子 句 形式 。 

记 住 ，Prolog 系统 并 不 知道 程序 中 谓词 的 意义 ， 它 只 是 根据 消解 法 则 以 完全 符号 的 方式 来 对 
语句 进行 操作 。 因此 ， 用 事实 和 规则 来 描述 谓词 的 有 关 特 性 完全 是 程序 员 的 职责 。 从 这 一 点 来 看 ， 
Prolog 的 事实 倾向 于 用 来 标识 特殊 谓词 的 实例 ， 而 规则 用 来 描述 一 般 的 法 则 。 这 就 是 前 面 有 关 谓 
词 faster 的 语句 所 使 用 的 方法 。 这 两 个 事实 描述 了 “ 快 ” 的 特定 实例 ， 而 规则 描述 了 一 个 一 般 
的 属性 。 注意 ， 免 子 比 蜗牛 快 的 事实 ， 尽 管 没 有 明说 ， 但 这 是 两 个 事实 通过 规则 结合 的 结论 。 

当 使 用 Prolog 语言 进行 软件 开发 时 ， 程 序 员 的 工作 就 是 开发 一 组 事实 和 规则 来 描述 已 知 的 
信息 。 这 些 事实 和 规则 构成 了 要 在 演绎 推理 系统 中 使 用 的 初始 语句 集合 。- 一 旦 这 个 语句 集合 确 
定 了 ,那么 可 以 向 系统 建议 一 些 猜测 (在 Prolog 术语 中 称 为 目标 ) 一 一 通常 通过 键盘 输入 它们 。 
当 这 样 的 一 个 目标 向 Prolog 系统 提交 后 ， 系 统 利用 消解 来 试图 证 明 这 个 目标 是 初始 语句 的 推导 
结果 。 基 于 描述 faster 关系 的 一 组 语句 ， 每 一 个 目标 


上 忌 S 七 全 T (七 QTL1e， Small) . 
上 aaStezr (Iabblt，turt1e) . 
二 忆 Ster (zabblit ， Small) ， 


部 可 以 证 明 ， 因 为 每 一 个 都 是 初始 语句 的 逻辑 结果 。 最 开始 的 两 个 识别 了 出 现在 语句 中 的 事实 ， 
而 第 三 个 需要 系统 的 某 种 程度 上 的 演绎 。 

如 采 我 们 提供 的 目标 的 变 元 不 是 常量 而 是 变量 ， 那 么 可 以 得 到 更 为 有 趣 的 例子 。 在 这 种 情 
纪 下 ，Prolog 试图 从 初始 语句 中 推导 出 目标 ， 同 时 跟踪 推导 所 需要 的 单一 化 。 然 后 ， 如 果 这 个 
目标 达到 了 ， 那 么 Prolog 将 报告 这 些 单一 化 。 例 如 ， 考 虑 目标 

上 起 Stez (， SBi1lL) 。 
Prolog 对 于 它 的 响应 是 报告 


上 上 引 BteT ( 廿 UYL 上 Te， Snmalil) ， 


[di 
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的 确 ， 这 征 急 始 语句 的 一 个 结论 ， 并 且 通 过 单一 化 与 这 个 目标 一 致 。 此 外 ， 如 果 要 求 Prolog 提 
供 更 多 的 结论 ， 那 么 它 会 找到 并 报告 下 面 的 结论 : 
二 总 号 七 皇 工 (1 工 羡 PbDbIiIt ， Snmalll ， 


而 我 们 能 通过 提出 

asStLer (rabbit，W) 。 
要 求 Prolog 寻 找 一 些 比 兔子 慢 的 动物 的 实例 。 事 实 上 ， 如 果 我 们 以 目标 

asSter(V， 克 ) . 
开始 ，Prolog 将 会 报告 所 有 的 可 以 从 初始 语句 中 推导 出 来 的 faster 关 系 。 这 意味 着 一 个 简单 的 
Prolog 程 序 可 以 用 来 证 明 某 种 特定 的 动物 比 另 一 种 快 ， 找 出 那些 比 某 种 给 定 的 动物 快 的 动物 ， 
找 出 那些 比 某 种 给 定 的 动物 慢 的 动物 ， 或 者 找 出 所 有 较 快 的 关系 。 

这 个 洪 在 的 多 功能 性 是 计算 机 科学 家 创造 的 。 遗 幅 的 是 ， 当 在 Prolog 系 统 中 实现 时 ， 消 解 
过 程 显示 了 和 它 理论 形式 中 并 没有 呈现 出 来 的 限制 。 这 样 Prolog 程 序 就 不 能 满足 它 预期 的 灵活 性 
变 求 。 为 了 理解 我 们 的 意思 ， 首 先 注意 图 6-25 中 的 示意 图 只 显示 了 与 手头 任务 相关 的 那些 消解 ， 
当然 还 有 其 他 一 些 消解 过 程 的 方向 。 例 如 ， 最 左 和 最 右 子 句 的 消解 ， 产 生 消解 物 Q。 这 样 ， 除 
了 描述 应 用 所 涉及 的 事实 和 规则 的 语句 外 ，Prolog 经 常 必 须 包 含 额 外 的 语句 ， 它 的 作用 是 为 了 
正确 地 指导 消解 过 程 。 由 于 这 个 原因 ， 实 际 的 Prolog 程 序 不 可 能 获得 我 们 先前 例子 所 建议 的 目 
的 多 样 性 。 


问题 与 练习 
1. 语句 R、$、T、U 和 V 哪 一 个 是 〈 一 RORT7TORS) 、( 一 SORY) 、( 一 VOR 员 ) 、 (了 人 了 一 5) 、 
(TOR V) 构成 的 集合 的 逻辑 结果 ? 
2 下面 的 语 杀 集合 是 相 容 的 吗 ?为 什么 ? 
POOR OOR 民 一 由 OOR 全 民间 有 RR 一 严 一 也 
3. 完成 下 和 面 的 Prolog 程 序 末 尾 的 两 个 规则 ， 以 使 得 谓词 mother (X，Y) 的 售 义 是 X 是 Y 的 母亲 ， 而 
Father lx,Y 衣 未 X 是 Y 的 父亲 。 
主 忆 In 忆 工程 【CarOL) 。 
二 人 下 已 (号 全 ) 。 
II 卫 工 所 【二 二 1) 
Tale (Jobhmi . 
户 Tent (ohn， C 二 TODO1L) . 
记 喜 工 和 让 有 亡 《 呈 UE ， 安 志 DD1) 
FIO 上 用 全 T(X， 芋 ) “一 
于 二 七 疾 人 T 《其 ， 革 ) 3 一 





4. 根据 问题 与 练习 3 中 的 Prolog 程 序 ， 下 面 的 规则 想 要 表述 这 样 的 含义 ， 即 刀 果 X 和 有 共同 的 父 桂 区 
是 Y 购 同胞 。 
号 工 扩 ] DC 可 (其 ， Y) 一 瑟 aFenmt 人 ， 壬 ) ， Rarenmt tfZ，) . 
复习 题 四 
( 带 * 的 题目 涉及 选读 小 节 的 内 容 。) 
1. 一 种 程序 设计 语言 是 机 器 独立 的 , 这 意味 着 什么 ? 机 器 语言 : 


2. 将 下 面 的 伪 代 码 程序 翻译 成 附录 C 中 描述 的 x-0; 


心 


上 有 


“四 


已 


忆 


10. 
11. 


上 


1 


WhileiIx<3l)aGo 
(其 < 一 其 十 ] ) 


. 将 语句 


Halfwave 二 Demngth + 人 让 1IGEhy; 
翻译 成 附录 C 中 描述 的 机 器 语言 ， 假 设 Length、 
width 和 Halfway 都 以 浮 点 型 表示 。 


, 将 高 级 语言 语句 


二 王 ( 屋 ecualS 0) 

七 也 所 卫 Z< 阅 十 册 

全 二 日 日 也 < 二- 平 上 十 及 
翻译 成 附录 C 中 描述 的 机 器 语言 ， 假 设 W、X、 
Y 和 2z 的 值 都 用 二 进 制 补 码 表示 ， 每 个 使 用 存 
储 器 中 的 一 个 字 节 。 


. 在 第 4 题 中 ， 为 了 翻译 这 些 语句 ， 为 什么 标识 


变量 的 数据 类 型 是 必要 的 ? 为 什么 许多 融 级 
程序 设计 语言 需要 程序 员 在 程序 的 开始 位 置 
标识 每 一 个 变量 的 类 型 ? 


. 说 出 并 描述 4 种 不 同 的 程序 设计 范 型 。 
. 假设 函数 /需要 两 个 数值 作为 它 的 参数 , 并 且 


它 要 返回 这 两 个 数 中 较 小 的 一 个 作为 它 的 输 
出 值 。 如 果 w、x*，y 和 z 者 代表 数值 ， 让 ff(w， 
，FO7， 荔 的 返回 结果 是 什么 ? 


. 假设 函数 三 返 回 的 结果 是 输入 的 字符 串 的 反 


序 , 并 且 函 数 8 返 回 和 输入 的 两 个 字符 串 的 连接 。 
如 果 x 是 字符 旨 abcd， 那 么 8Uf on， 加 的 返回 值 
是 什么 ? 

假设 你 要 写 一 个 面向 对 象 程 序 来 维护 你 的 财 
务 记 录 。 在 表示 活期 账户 的 对 象 里 应 该 存放 什 
人 么 数据 ? 这 个 对 象 会 啊 应 什么 样 的 请 妃 ? 程 
序 中 可 能 使 用 的 其 他 对 象 是 什么 ? 
概述 机 器 语言 和 汇编 语言 的 区 别 。 

为 附录 C 中 描述 的 机 器 语言 设计 一 个 汇编 


. 程序 员 John 认 为 在 程序 中 声明 一 个 常量 的 功 


能 是 不 必要 的 ， 因 为 可 以 用 一 个 变量 来 代替 
它 。 例 如 ， 在 6.2 节 中 的 aAirportalt 的 例子 
中 ， 可 以 把 Airportalt 声 明 为 一 个 变量 ， 
然后 在 程序 开始 的 时 候 为 其 赋 需 要 的 值 . 为 什 
么 这 种 方法 不 如 司 用 常量 好 ? 


. 概述 声明 性 语句 和 命令 型 语句 之 间 的 区 别 。 
. 解释 字面 量 、 常 量 和 变量 之 间 的 区 别 。 
, 8a. 什么 是 运算 符 优 先 级 ? 


b, 根据 运算 符 优 先 级 ， 表 达 式 6+2X3 的 值 是 
什么 ? 


. 什么 是 结构 化 程序 设计 ? 


之 ] . 


FF 


了 


24. 





复习 题 207 
, 语句 
1 ( 民 = 5) 七 henm ( -|) 
中 的 等 号 和 赋值 语句 
其 = 人 十 种 
中 的 等 号 的 区 别 是 什么 ? 


- 团 一 个 流程 图 来 表 秒 下面 的 for 语 句 所 表 冯 


的 结构 。 


芋 白 立 ( 工 记 七 其 三 立 其 < 日 十 十 其 ) 


【二 
. 用 第 5 瘟 伪 代码 中 的 while 语 句 把 下 列 的 for 语 


名 翻译 成 等 效 的 程序 段 。 


Cr InmtX = 了 蔗 日 十 + 区 


[3 

如 果 你 熟悉 乐谱 , 像 程 序 设 计 语言 那样 分 析 乐 
谱 符 号 .什么 是 控制 结构 ?什么 是 捅 入 程序 注 
释 的 语法 ? 什么 音乐 符号 有 类 羽 于 图 67 中 的 
for 语 句 的 语 尽 ? 

团 一 个 流程 图 来 表示 下 面 的 语句 所 表达 的 结 
构 。 

Switch (suity) 

了 11) ; 

"已 1amcnas" : Piadf2l: 
bl13(3) ; 

所 11d4) ; 


{ 各 虽 已 CLUB  : 
安 忆 马扎 
避 号 车 和 导 吉 站 于 总 


CaSse "SDaaQesn": 


} 
重 写 下 面 的 程序 段 ， 使 用 case 语 名 代替 嵌 套 
的 iEE-then-else 语 句 。 
二 三 〈W=5) 
七 巧 昌 DZ- 一 7) 
( 主 硅 《 风 =6) 
thbhentY<7) 
( 主 硅 《W= 了 ) 
七 乒 已 也 【其 < 一 了) 
) 


避 】 纪 尾 


= 有 本] = 


| 
使 用 一 个 if-then-else 语 句 ， 概 括 下 面 的 
例 程 : 
1 X> 5 七 ben 9oto 80 
基 = 县 + 二 
可 避 七 口 90 
8D0 其 = 其 + 了 


急电 “号 七 扬 王 
为 了 实现 下 述 每 个 活动 , 概述 命令 型 语言 和 面 


癌 对 象 语 言 中 的 基本 控制 结构 。 
a._ 判断 将 要 执行 哪 一 条 命令 。 


上 
3 
5 
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之 


Cn 


迪 ，， 


28. 


忆 吕 


29， 


30U. 


了 


Ci 


32. 


33. 
34. 
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b. 重复 一 组 命令 。 
c. 改变 变量 的 值 。 


: 概述 翻译 器 和 解释 器 的 区 别 。 
26. 


假设 程序 中 的 变量 X 声 明 为 整 型 。 当 执行 语句 
上 二， 

时 ， 会 发 生 什 么 错误 ? 

说 一 个 程序 设计 语言 是 强 类 型 的 意味 着 什 


委 ? 


为 什么 一 个 大 的 数组 不 太 可 能 通过 按 值 传递 


的 方式 传递 给 过 程 ? 
假设 过 程 Modify 用 第 5 章 的 伪 代 码 定义 为 
Procedure ModifyY) 

站 人 

打印 Y 的 值 
如 果 参 数 是 按 值 传递 的 , 当 执 行 下 面 这 个 程序 
段 时 , 会 打印 出 什么 结果 ? 如 果 参 数 是 按 引用 
传递 呢 ? 
此 = 5; 
对 X 应 用 Modify 过 程 ， 
打印 X 的 值 ; 


假设 过 程 Modify 用 第 5 章 的 伪 代 码 定义 为 
procedure Modify(Y) 

站 

打印 X 的 值 ; 

打印 Y 的 值 ; 
假设 X 是 全 局 变量 。 如 果 人 参数 按 值 传递 ， 那 委 
执行 下 面 的 程序 会 打印 出 什么 结果 ? 如果 参 
数 是 按 引 用 传递 呢 ? 
上 其 < 9， 
对 X 应 用 Modify 过 程 ; 
打印 X 的 值 ; 
有 时 , 把 实 参 传 递 给 一 个 过 程 时 是 通过 产生 -- 
个 副本 给 过 程 使 用 (如 果 按 值 传递 时 ) ， 但 在 
过 程 完 成 时 , 过 程 的 副本 里 的 值 在 调用 过 程 继 
续 执 行 之 前 传递 给 实 参 。 在 这 种 情况 下 , 称 参 
数 是 技 值 -结果 传递 的 。 如 果 参 数 按 值 - 结 洒 传 
递 ,那么 第 30 题 的 程序 段 会 打印 出 什么 结果 ? 
a. 按 引 用 传递 相对 于 按 值 传 递 有 哪些 优点 ? 
b. 控 值 传递 相对 于 按 引用 传递 有 哪些 优点 ? 
语句 X 一 3+2X5 存 在 什么 歧义 ? 
假设 一 个 小 公司 有 5 名 雇员 ， 并 且 计 划 增 加 雇 
员 数 目 到 6 名 。 下 面 的 赋值 语句 是 该 公司 一 个 
程序 中 的 语 铝 : 


DailySalarv= ToaotalSsaly75; 


35. 


36. 


39. 


下 


-al 


42. 


1 


二 3. 


avVGSalary = TotaleSsaly/5， 
DailySales =TotalSsalesy/5， 
AvSSales = TotalSales/5， 


那么 ， 如 果 原 程序 使 用 了 NumberOofgmp 和 
WorkWeek 两 个 常量 〈 值 都 为 59) ， 如 何 简化 
更 新 程序 的 任务 才能 使 赋值 语句 表达 为 ， 


卫 站 1YSa1 ar =TOfalSalyDayrsWk ， 

各 W 可 与 忆 总 Y = TotalSsalyNumEmp1l，; 
DailygSales = OfLa SBLesADavSsWK， 

矶 W 可 己 忆 1 扎 忆 = TOtalSalesyNumEnmp1l， 

a. 形式 语言 和 自然 语言 之 间 的 区 别 是 什么 ? 
b. 分 别 举例 。 

用 语法 图 来 表示 第 5 章 的 伪 代 码 中 的 while 语 
句 的 结构 。 


: 慷 计 一 组 语法 图 来 描述 你 所 在 区 域 的 电话 号 


人 码 的 语法 , 例如 在 美国 , 电话 号 码 由 分 区 电话 
与 码 、 地 区 电话 号 码 和 一 个 4 位 数字 组 成 ， 如 
(444) 555-1234。 


. 设计 一 组 语法 图 来 描述 你 的 母语 里 的 一 个 简 


单 的 句子 。 
设计 一 组 语法 图 来 描述 不 同 的 表示 日 期 的 方 
法 ， 如 “月 /日 /年 ”或 是 “月 /日 ， 年” 


:设计 一 组 语法 图 来 描述 下 述 句子 的 文法 结构 ; 


在 yes 的 后 面 有 与 yes 个 数 相 同 的 no。 例 如 句子 
“yes yes no no ”符合 要 求 ， 而 句子 “no yes”、 
“yes no np” 和 “yes no yes” 就 不 满足 要 求 。 


. 有 一 种 句子 是 这 样 的 ; 在 yes 的 后 面 有 与 yes 个 


数 相同 的 no， 在 其 后 又 有 相 同 数目 的 maybe， 
例如 , “yes no maybe”、 “Yes yes no no Imaybe 
maybe” 就 是 这 样 的 句子 ， 而 “yes maybe”、 
“yes no no maybe maybe”、 “maybe no” 都 
个 是 。 给 出 一 个 论据 说 明 这 种 句子 的 文法 结构 
的 语法 图 的 集合 不 能 被 设计 出 来 。 

写 一 个 句子 描述 下 面 语法 图 所 定义 的 字符 串 的 
结构 ， 然 后 ， 画 出 字符 串 xxyxx 的 语法 分 析 树 。 


字符 串 


Ce 证 字符 中 上 CR 
Ce 


为 6.4 节 中 的 问题 4 增加 语法 图 ， 以 得 到 一 个 定 
义 Dance 结 构 为 Chacha 或 者 为 Walts 的 一 组 语 
法 图 ， 其 中 Walts 包 括 一 个 或 多 个 以 下 模式 的 
剧本 : 

forward diapgonal close 


43. 


二 /7， 


二 8， 


49. 


50. 
51. 


52. 


1 


或 
backward diagonal close 


. 基于 图 6-15 中 的 语法 图 ， 为 表达 式 XXY 二 YY 一 X 


国 出 语法 分 析 树 。 
当 为 下 面 的 语句 生成 机 器 代码 时 , 代码 生成 器 
可 以 实现 哪些 代码 优化 ? 
1E(X = 5) then (Z 二 和 + 2) 
已 LSBBe (2 二 和 + 4) 


. 简化 下 面 的 程序 段 ， 


人 
(YY = 7 了) 

七 瑟 eD (2 日 ) 

避 二 日 已 (Z < 一 9) 
简化 下 面 的 程序 段 ， 
While (X not equal to 5)ao 

( 式 < 二 口 ) 

在 面 网 对 象 程序 设计 环境 中 , 类 型 和 类 有 哪些 
相似 ， 又 有 哪些 不 同 ? 
描述 不 同类 型 建筑 的 类 的 开发 是 如 何 使 用 继 
承 的 ? 
在 类 中 私有 部 分 与 会 有 部 分 的 区 别 是 什么 ? 
a_ 给 出 一 个 实例 变量 应 该 是 私有 的 例子 。 
b. 给 出 一 个 实例 变量 应 该 是 公有 的 例子 。 
c. 给 出 一 个 方法 应 该 是 私有 的 例子 。 
d. 给 出 一 个 方法 应 该 是 公有 的 例子 。 
说 明 在 模拟 酒店 门厅 里 行人 交通 时 可 能 需要 


JP EECETPSEOP 


社会 问题 


直入 本 下 -二 站- 和 站 村 证 本 站 H 晤 辣 有 0 村 电 生计 直 直 二 本 和- 全 人 


3 灿 


本 4. 


站 和. 


本 和 全 


1 
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的 一 些 对 象 以 及 某 些 对 象 需要 实现 的 动作 。 
画 一 个 表示 消解 的 图 (类似 于 图 6-25) ， 来 说 
明 语句 (CQ@OR 一 R) 、(TORR) 、 一 P、 
(POR 一 7T) 和 (POR 一 O) 集合 是 不 相 容 的 。 
语句 一 R、(TORR) 、(POR 一 0O) 、(POR 
一 7T) 和 (CROR 一 P) 集 人 台 是 相 容 的 吗 ? 解释 
你 的 回答 。 

扩展 第 6.7 节 中 问题 3 和 4 描述 的 Prolog 程 序 , 以 
包 售 另 外 的 家 庭 关 系 ， 如 : 上 叔叔、 阿姨、 祖父 
母 和 向 兄 弟 。 还 要 增加 定义 Parent (x，Y， 
z) 的 规则 ，Pparent (x，Y，z) 的 意思 是 ; x 
和 Yy 是 z 的 父母 。 

假设 下 列 Prolog 程 序 的 第 一 条 语句 意味 “Alice 
喜欢 运动 ”， 翻 译 程 序 中 的 最 后 两 个 语句 。 然 
后 ， 基 于 这 个 程序 ， 列 出 Prolog 将 能 得 出 的 
Alice 喜 欢 的 所 有 事情 。 

] 工 其 已 号 【总 工 1 己 所 ，SPortB) ， 

1 工 KeS { 引 LIece,musiecl ， 

工 工 其 全 号 【 妆 电 荆 口 1 ,muEdCe) ， 


1IKes (dav1liad,Xx) :- 11iKkes(Xx,SDPOTtS) . 
11kKkeSs (aliceyX) :- 1ikesfeavid,X) 。 


如 傈 下 面 的 程序 段 在 一 台 用 1.7 节 中 描述 的 8 
位 秀 点 格式 表示 数值 的 机 器 上 执行 ,会 遇 到 什 
人 么 问题 ? 

< 心 .由 1 

Wimhd1e(X mcot eaual to 1.00) do 


(PEIImL 七 he Value of X; 
XXX + 0.01) 


Ti 





下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问 题 。 回 答 这 些 问 题 不 
古 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回 答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 


1. 通 币 ， 


版 权 法 支持 与 一 个 想法 的 表达 有 关 的 所 有 权 ， 而 不 是 这 个 想法 本 身 。 因 此 ， 一 本 


忆 中 一 节 是 受 版 权 法 保护 的 ， 但 是 这 一 节 表 述 的 思想 就 不 受 保护 。 这 种 权利 如 何 应 用 到 
源 程序 和 它 表达 的 算法 昵 ? 一 个 了 解 商业 软件 中 所 使 用 的 算法 的 人 ， 应 当 在 多 大 程度 上 
允许 他 目 己 编写 表达 这 些 相同 算法 的 程序 ， 并 将 这 个 软件 推 向 市 场 ? 

2. 通过 使 用 高 级 程序 设计 语言 , 程序 员 可 以 使 用 诸如 if.then 和 while 这 样 的 单词 来 表达 算法 。 
计算 机 理解 这 些 词 的 含义 到 了 什么 程度 ? 正确 应 对 这 些 词 的 使 用 的 能 力 意 味 着 对 词语 理 


解 了 吗 ? 你 怎么 知道 另 一 个 人 理解 了 你 所 说 的 ? 


3. 一 个 开发 新 的 有 用 的 程序 设计 语言 的 人 应 当 有 从 这 个 语言 的 使 用 中 获 利 的 权利 吗 ? 如果 
有 ， 如 何 保证 这 样 的 权利 ? 一 种 程序 设计 语言 可 以 被 拥有 到 多 大 程度 ? 公司 对 雇员 创新 


的 智力 成 果 有 多 大 程度 上 的 所 有 权 ? 


4. 在 临近 最 后 期 限时 ， 一 个 程序 员 打 算 放 弃 用 注释 语句 编制 文档 以 使 程序 能 够 按时 完成 ， 
这 可 以 接受 吗 ? 《初学 者 在 得 知 文档 对 于 一 个 专业 的 软件 开发 人 员 是 如 何 重 要 时 ， 人 往往 


Ca | . 
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非常 惊讶 。) 

5. 许多 程序 设计 语言 已 经 可 以 使 程序 员 编写 出 易 读 量 容易 理解 的 程序 在 多 大 程度 上 应 当 

和 要 求 程 序 员 使 用 这 些 能 力 ? 也 就 是 说 ， 对 于 能 够 正确 实现 功能 但 从 人 的 角度 看 来 写 得 不 
322 好 的 程序 ， 在 什么 程度 上 才 算 是 好 程序 ? 

6. 假设 一 个 业余 程序 员 写 了 一 个 程序 供 自己 使 用 。 这 个 程序 没有 使 用 程序 设计 语言 的 易 读 
特性 ， 它 也 不 够 高 效 ， 并 且 包 含 了 利用 特殊 情况 《这 个 程序 员 试图 使 用 这 个 程序 的 特殊 
环 攻 ) 的 省 事 方法 。 此 后 ， 这 个 程序 员 把 它 的 程序 复制 给 希望 使 用 这 个 程序 的 朋友 ， 而 
他 的 朋友 又 把 这 个 程序 复制 给 了 他 们 的 朋友 。 这 个 程序 员 要 为 他 的 程序 可 能 出 现 的 问题 
负 多 大 责任 ? 

7. 计算 机 专业 人 员 对 于 各 种 程序 设计 范 型 应 该 精通 到 什么 程度 ? 茶 些 公司 坚持 在 公司 的 所 
有 软件 开发 中 都 使 用 同一 种 预先 确定 好 的 程序 设计 语言 来 编写 。 如 果 在 这 种 公司 工作 ， 
你 对 前 面 问题 的 回答 是 否 会 发 生变 化 ? 


E 生 和 ET 放下 天 和 穗 cr 后 下 下 半生 RE 下 拓 于 避 LPEH 由 证 和 和 和 本 部下 由 JP 于 JE 让 作 W 和 La 
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章 讨论 的 是 在 开发 大 型 的 复杂 软件 系统 过 程 中 遇 到 的 问题 .之 所 以 将 这 门 学 科 称 为 软 
件 工程 ， 是 因为 软件 开发 是 一 个 工程 化 的 过 程 。 研 究 软 件 工程 的 目标 就 是 要 找到 一 种 
原则 ， 能 够 指导 软件 开发 过 程 ， 进 而 生产 出 高 效 的 、 可 靠 的 软件 产品 。 
软件 工程 是 计算 机 学 科 中 的 一 个 分 支 ， 致 力 于 寻找 指导 大 型 复 录 的 软件 系统 的 开发 怕 则 。 
开发 这 类 系统 所 面 对 的 问题 并 非 只 是 编写 小 程序 所 面 对 问 题 的 放大 。 比 如 说 ， 开 发 大 型 系统 的 
时 候 ， 要 求 许多 人 工作 很 长 时 间 ， 而 在 这 期 间 ， 预 期 的 系统 需求 可 能 会 改变 ， 参 与 该 项 目的 人 
员 也 可 能 会 变动 。 因 此 ， 软 件 工程 包括 了 诸如 人 员 管 理 和 项 目 管 理 之 类 的 主题 ， 这 样 的 主题 更 
多 与 业务 管理 相关 ， 而 不 是 与 计算 机 科学 相关 。 当 然 ， 我 们 的 侧重 点 还 是 放 在 那些 与 计算 机 科 
学 密切 相关 的 主题 上 。 
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为 了 有 助 于 理解 软件 工程 中 涉及 的 问题 ， 这 里 可 以 想象 构造 一 个 大 型 的 复杂 设施 《一 辆 汽 
车 、 一 蛋 办 公 大 楼 或 者 一 座 教 党 )， 对 此 进行 设计 ， 然 后 监管 其 构建 过 程 : 如 何 估算 完 成 该 项 目 
所 需 的 时 间 、 费 用 以 及 其 他 资源 ? 如 何 把 项 目 分 割 成 几 个 便于 管理 的 模块 ? 如 何 保证 构建 的 模 
块 相互 协调 一 致 ? 如 何 使 工作 在 不 同 模块 的 人 员 相互 沟通 ? 如 何 检查 进度 ? 如 何 妥 着 处 理 更 三 
泛 的 细节 问题 〈 如 门 把 手 的 选择 、 壁 饰 的 设计 、 彩 色 玻 璃 窗 的 蓝 色 玻 璃 的 需求 量 、 柱 子 的 强度 、 
供暖 系统 的 管道 设计 等 ) ? 在 一 个 大 型 软件 系统 的 开发 过 程 中 ， 同 样 需要 面 对 如 此 系 多 的 问题 。 

有 人 也 许 会 这 样 认 为 ， 工 程 是 一 个 很 成 熟 的 领域 ， 因 此 一 定 会 有 现成 的 工程 技术 可 以 用 来 
解决 软件 工程 中 的 这 些 问题 。 这 种 推理 有 一 定 的 道理 ， 但 是 忽略 了 软件 的 特性 与 其 他 工程 领域 
特性 之 间 存 在 着 本 质 上 的 不 同 。 这 些 差别 已 经 影响 了 软件 工程 项 目 ， 导 致 其 花费 的 增加 、 推 迟 
交付 软件 产品 和 软件 产品 不 能 满足 用 户 的 需求 等 后 果 。 所 以 ， 在 发 展 软 件 工程 学 科 上 ， 首 先 要 
做 的 工作 是 弄 清 这 些 将 别 。 

差别 之 一 是 处 理 通过 常用 的 预先 定制 的 构件 来 构建 系统 的 能 力 。 一 些 传统 的 工程 领域 已 经 
长 期 受益 于 这 种 方法 ， 即 在 构建 复杂 的 设备 时 ， 采 用 各 种 现成 构件 。 例 如 ， 设 计 一 辆 新 车 时 ， 
没有 必要 重新 设计 新 的 引擎 和 传感器 ， 只 需 利 用 这 些 构件 以 前 的 设计 方案 即 可 。 然 而 ， 软 件 工 
程 在 这 一 点 上 却 是 很 落后 的 。 过 去 ， 以 前 设计 的 软件 构件 一 般 倾 问 于 用 于 特定 的 领域 。 也 承 是 
说 ， 这 些 构 件 本 质 上 是 为 专门 的 应 用 而 设计 的 ， 所 以 ， 将 它们 作为 通用 构件 来 使 用 是 受 限 的 。 
因此 ， 复 杂 的 软件 系统 历来 都 是 从 头 做 起 。 正 如 在 这 一 章 中 我 们 将 看 到 的 那样 ， 在 这 一 点 上 已 
经 取得 了 重要 的 进展 ， 尽 管 还 有 很 多 工作 要 做 。 

软件 工程 与 其 他 工程 学 科 间 的 另 一 个 差别 在 于 缺少 度量 技术 ， 称 为 度量 学 (metrics)， 来 衡 
量 软件 的 属性 。 例 如 ， 为 了 计算 开发 一 个 软件 系统 的 费用 ， 人 们 和 希望 能 够 们 算出 预期 产品 的 复 
杂 度 ， 但 是 ， 软 件 的 复杂 度 估算 方法 还 不 太 成 熟 。 同 样 ， 评 价 软件 的 质量 的 方法 现在 也 不 太 成 
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熟 。 对 于 机 器 设备 ， 质 量 的 重要 量度 是 平均 无 故障 时 间 ， 这 是 对 设备 的 耐 损耗 性 的 一 个 基本 的 
衡量 指标 。 相 反 ， 软 件 没有 损耗 ， 所 以 这 种 方法 在 软件 工程 中 并 不 适用 。 

软件 指标 不 能 以 定量 的 方式 测量 ， 这 也 是 软件 工程 和 机 械 、 电 子 工程 不 同 ， 至 今 还 未 找到 
一 个 严格 、 坚 实 的 立足 点 的 主要 原因 。 这 些 早 些 的 学 科 〈 如 机 械 和 电子 工程 ) 是 建立 在 成 熟 的 
物理 学 科 的 基础 上 的 ， 然 而 ， 软 件 仍 然 在 找寻 其 自身 的 根基 。 

因而 ， 现 在 的 软件 工程 研究 在 两 个 层面 上 进行 ， 一 部 分 研究 者 《有 时 也 称 之 为 实践 派 ) 的 
工作 指向 开发 直接 应 用 的 技术 ; 另 一 部 分 研究 者 〈 称 之 为 理论 派 ) 则 致力 于 探寻 软件 工程 的 基 
础 原理 和 理论 ， 为 将 来 构建 更 坚实 的 技术 而 努力 。 基 于 自身 的 原因 实践 派 以 前 开发 和 提出 的 
许多 方法 已 经 被 其 他 方法 代替 ， 新 的 方法 可 能 也 将 随 着 时 间 的 推移 而 淘汰 。 与 此 同时 ， 理 论 派 
的 进展 也 是 一 直 很 缓慢 。 

对 实践 派 和 理论 派 的 两 方面 的 进展 需求 是 巨大 的 。 我 们 这 个 社会 已 经 沉迷 于 计算 机 系统 
及 其 相关 的 软件 。 我 们 的 经 济 、 保 健 、 政 府 、 法 律 实施 、 交通 运输 以 及 国防 系统 等 都 依赖 于 
大 型 的 软件 系统 。 然 而 ， 在 这 些 系 统 中 ， 可 车 性 依然 是 最 主要 的 问题 。 软 件 错误 已 经 导致 了 
一 些 大 的 灾难 ， 新 近 的 灾难 如 月 亮 的 升 起 被 误 以 为 是 核 攻击 、 纽约 银行 造成 的 一 天 损失 5$00 
万 美元 、 空 间 探测 器 的 失踪 、 过 量 的 辐射 导致 人 员 的 伤 残 ， 还 有 电话 通信 在 同一 时 间 大 面积 
的 瘫痪 等 。 

这 并 不 是 说 情况 都 很 悲观 。 我 们 已 经 在 解决 诸如 缺少 预制 的 构件 和 衡量 标准 等 问题 方面 取 
得 很 多 进展 。 此 外 ， 由 于 计算 机 技术 在 软件 开发 过 程 中 的 应 用 ， 导致 了 称 为 计算 机 辅助 软件 工 
程 《computeraided software engineering，CASE) 的 出 现 ， 这 使 软件 开发 流程 化 ， 从 而 简化 了 软 
件 的 开发 过 程 。CASE 已 经 促进 了 许多 计算 机 化 系统 的 发 展 ， 最 有 名 的 就 是 CASE 工 具 〔CASE 
tool)， 它 包含 了 项 目 设 计 系统 (用 来 辅助 经 费 预 算 、 项 目 调度 以 及 人 员 分 配 等 )、 项 目 管 理 系 统 
〈 用 来 辅助 监控 项 目的 开发 进度 )、 文 档 工 具 〈 用 来 辅助 编写 和 组 织 文档 )、 原型 与 仿真 系统 〈 用 
来 辅助 开发 原型 系统 )、 界 面 设 计 系统 用 来 辅助 图 形 用 户 界 面 的 开发 )、 编 程 系统 〈 用 来 辅助 
肪 号 和 调试 程序 ) 等 。 其 中 一 些 工 具 的 功能 和 字 处 理 程序 、 电 子 制 表 软 件 、 电子 邮件 通信 系统 
等 差不多 ， 最 开始 开发 出 来 是 于 一 般 的 应 用 ， 并 为 软件 工程 所 采用 。 男 外 的 一 些 工具 主要 是 为 
软件 工程 环境 专门 定制 的 软件 包 。 实 际 上 ， 被 称 为 集成 开发 环境 (integrated development 
environment IDE) 的 系统 把 软件 开发 工具 〈 编 辑 器 、 编 译 器 、 调 试 工具 等 ) 组 合 到 单个 集成 的 
程序 包 中 ， 有 些 还 提供 了 可 视 化 编程 〈visual programming) 特性 ， 其 中 程序 是 被 在 计算 机 上 显 
示 为 表示 构建 块 的 图 标 可 视 化 地 构造 。 

除了 研究 人 员 ， 专 业 人 士 和 标准 化 组 织 〈 和 包括 ISO) 的 努力 ， 美国 计算 机 协会 (ACM) 和 
美国 电气 及 电子 工程 师 协会 (IEEE) 也 已 经 加 入 到 改善 软件 工程 状态 的 挑战 中 。 这 些 努 力 包括 ， 
有 沙 用 职业 行为 规范 和 道德 规范 来 增强 软件 开发 人 员 的 职业 精神 ， 到 对 对 个 人 职责 的 漠视 态度 ; 
建立 衡量 软件 开发 组 织 质量 的 标准 ， 提供 帮助 这 些 组 织 改 善 它们 标准 的 指导 方针 。 


美国 计算 机 协会 人 
美国 计算 机 协会 (ACM ) 成 立 于 1947 年 ， 是 致力 于 推动 艺术、 科学 及 信息 技术 应 用 的 国 
际 性 科学 与 教育 组 织 。 其 总 部 在 纽约 ， 下 设 许多 专业 的 工作 组 【SIG) 分 别致 力 于 计算 机 体 
系 结构 、 人 工 知 能、 生物 医 学 计算 、 计 算 机 与 社会 、 计 背 机 科学 教育 、 计 算 柄 图 形 学 、 超 文 
本 / 超 媒体 、 操 作 系 统 、 程 序 设 计 语 言 、 份 真 与 建 模 和 软件 工程 等 主题 。ACM 的 网 站 地 址 是 
RhttPp:77www.acm.org。 其 职业 道德 和 行为 准则 可 在 http:/VAwww .acm.orgy/GenStdtu- 
kioconycoae .htmi 中 技 到 ， 
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美国 电气 及 电子 工程 师 协会 

美国 电气 及 电子 工程 师 协会 (IEEE， 读 作 “i-triple-e” ) 是 一 个 电气 、 电 子 和 制造 工程 师 
的 组 织 , 成 立 于 1963 年 , 由 美国 电气 工程 师 协会 (由 包括 爱迪生 在 内 的 25 名 电气 工程 师 于 1884 
年 创建 的 ) 和 半 国 无 线 电工 程 师 协 会 (创建 于 1912 年 ) 合并 而 成 。 今 天 ，]EEE 的 执行 中 心 位 
于 新 泽 西 州 的 皮 斯 卡 塔 书 。 协 会 有 许多 技术 分 会 组 成 ， 如 航天 和 电子 系统 协会 、 激 光 和 光电 
子 协会 、 机 器 人 和 自动 化 协会 、 交 通 运输 技术 协会 以 及 (对 我 们 的 学 习 最 重要 的 ) 计算 机 协 
会 .IEEE 也 ,参与 了 各 种 标准 的 开发 与 制定 。 特 别 是 ，IEEE 的 努力 产生 了 今天 仍 在 大 多 数 计 算 
机 上 使 用 的 用 浮 点 格式 表示 值 的 标准 。 

IEEE 的 主页 地 址 是 http:/Vwww.ieee.org，IEEE 的 计算 机 协会 的 主页 地 址 是 http:y7/ 
www .comnputer.org，IEEE 的 道德 规范 标准 的 主页 地 址 是 http: /www.ieee.ordyabout/ 
WatiSsAceode .ntnml 。 


本 章 的 其 余部 分 将 讨论 软件 工程 的 一 些 基 本 原理 (如 软件 的 生命 周期 和 模块 化 等 ), 预测 软 
件 工 程 发 展 的 一 些 动向 (如 设计 模式 的 定义 与 应 用 以 及 可 复 用 软件 构件 的 出 现 等 )， 以 及 考察 面 
向 对 象 模型 对 这 个 领域 产生 的 影响 。 
问题 与 练习 
1. 为 什么 一 个 程序 中 的 代码 行 的 数量 并 非 是 对 程序 复杂 性 的 一 种 好 的 度量 ? 
2. 提出 一 种 测量 软件 质量 的 量度 建议 ， 并 说 明 这 种 量度 有 什么 缺点 ? 
3. 什么 样 的 技术 能 用 来 确定 一 个 软件 单元 中 有 和 多少 错误 ? 
4. 列举 出 两 个 在 软件 工程 领域 已 经 或 当前 正在 改善 的 应 用 范例 。 
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软件 工程 最 基础 的 概念 就 是 软件 生命 周期 。 


7.2.1 周期 是 个 整体 


图 7-1 表 示 的 是 软件 的 生命 周期 。 这 个 图 表明 了 一 个 事实 ， 即 软件 *- 旦 开发 完成 ， 它 就 进入 
了 一 个 既 被 使 用 又 被 维护 的 循环 ， 这 个 循环 将 永 不 停止 ， 直 至 软件 生命 周期 结束 。 这 种 模式 在 
许多 产品 制造 中 很 常见 。 不 同 之 处 在 于 ， 在 其 他 产品 制造 中 ， 维 护 阶 段 往往 是 一 个 修复 过 程 ; 
而 对 于 软件 ， 维 护 阶段 往往 包括 改 错 和 更 新 。 实 际 上 ， 软 件 进 入 维护 阶段 ， 是 由 于 以 下 的 原因 
有 现 了 错误 ， 软 件 应 用 中 发 生 的 变化 需要 在 软件 中 做 相应 的 修改 ， 或 者 上 一 次 修改 中 的 变更 导 
致 软件 中 其 他 地 方 出 现 了 问题 。 


并 发 一 


1 
图 7-1 软件 的 生命 周期 
无 论 软 件 因为 什么 样 的 原因 进入 修改 阶段 ， 这 个 过 程 都 要 求人 员 〈 通 常 不 是 原作 者 ) 研究 
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底层 的 程序 及 其 文档 ， 直 至 把 这 个 程序 〈 或 者 至 少 是 程序 的 相关 部 分 ) 理解 清楚 。 和 否则 ， 任 何 
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的 改动 只 会 带 来 更 多 的 问题 。 即 使 软件 设计 精良 并 有 良好 的 文档 ， 要 达到 这 种 理解 也 是 一 个 困难 
的 事情 。 事 实 上 ， 到 了 这 个 阶段 ， 该 软件 往往 会 因为 从 头 开发 一 个 新 系统 要 比 成 功 修改 现存 的 软 
件 包 要 更 容易 这 样 一 个 借口 而 弃 之 不 用 〈 通 常 这 个 借口 也 是 真实 的 )。 

经 验 表明 ， 在 软件 开发 期 间 稍 作 努 力 ， 就 会 在 需要 对 软件 进行 修改 时 产生 很 不 同 的 后 条 。 
例如 ， 在 第 6 章 讨 论 数据 描述 语句 中 ， 我 们 可 以 看 出 ， 在 以 后 的 修改 中 ， 使 用 常量 比 字面 量 要 
简单 得 多 。 结 果 是 ， 软 件 工程 的 大 部 分 研究 工作 集中 在 软件 生命 周期 的 开发 阶段 ， 以 达到 这 种 
付出 与 收益 之 间 的 获 利 目标 。 


7.2.2 ”传统 的 开发 阶段 
软件 生命 周期 的 传统 的 开发 阶段 的 主要 步骤 是 需求 、 设 计 、 实 现 和 测试 《参见 图 7-2)。 


wa 


需求 分 析 


届 夺 


图 7-2 ”软件 生命 周期 的 传统 的 开发 阶段 


1. 需求 分 析 

软件 生命 周期 的 开发 阶段 从 需求 分 析 ， 其 主要 目标 是 确定 预期 系统 要 提供 的 服务 ， 这 些 服 
务 的 运行 条 件 〈 如 时 间 限 制 、 安 全 性 等 )， 以 及 定义 外 界 与 系统 的 交互 方式 。 

需求 分 析 包括 来 自 预期 系统 的 利益 相关 者 〈stakeholder) (将 来 的 使 用 者 ， 还 有 其 他 有 关联 
的 人 ， 比 如 法 律 上 或 者 财务 上 相关 的 人 ) 提供 的 重要 数据 。 事 实 上 ， 如 果 终 端 用 户 是 一 个 实体 
(如 公司 或 政府 机 构 )， 他 们 会 为 软件 项 目的 实际 执行 雇用 软件 开发 者 ， 需 求 分 析 可 能 开始 于 用 
户 独自 进行 的 可 行 性 研究 。 在 其 他 一 些 情 况 下 ， 软 件 开发 者 可 能 为 大 众 市 场 生产 软件 ， 这 些 软 
件 或 许 在 零售 商店 销售 ， 或 许 通过 因特网 下 载 。 在 这 种 情况 下 ， 用 户 不 需要 准确 地 定义 实体 ， 
需求 分 析 可 能 要 从 软件 开发 者 的 市 场 调 研 开始 。 

在 任何 情况 下 ， 可 行 性 研究 最 终 会 产生 需求 规格 说 明 中 的 内 容 。 这 一 过 程 包括 编写 和 分 析 软 
件 用 户 的 需求 ， 和 项 目的 利益 相关 者 协商 ， 在 一 般 需 求 、 核 心 需求 、 费 用 和 可 行 性 之 间 权 衡 ， 最 
终 确 定 的 需求 要 明确 最 终 的 软件 系统 必须 具有 的 特性 和 服务 。 这 些 需 求 被 记录 在 一 个 称 为 软件 需 
求 规格 说 明文 档 〈software requirements specification document) 中 。 从 某 种 意义 上 讲 ， 这 个 文档 是 
所 涉及 的 各 方 之 间 达 成 的 书面 确认 ， 它 的 目的 是 指导 软件 开发 ， 也 为 日 后 开发 过 程 中 可 能 产生 的 
分 歧 提 供 了 解决 方法 。 像 IEEE 这 样 的 专业 组 织 和 美国 国防 部 这 样 的 大 型 软件 客户 都 已 经 采用 了 软 
件 需 求 规格 说 明文 档 编 写 的 标准 ， 这 样 的 事实 已 经 证 明 ， 软 件 需 求 规格 说 明文 档 十 分 重 娶 。 

从 软件 开发 者 的 角度 来 看 ， 软 件 需 求 规格 说 明文 档 应 该 能 够 为 软件 的 开发 顺利 进行 制定 严 
格 的 目标 。 然 而 ， 大 多 数 情况 下 ， 需 求 文档 很 难 提供 这 种 稳定 性 。 事 实 上 ， 软 件 工程 领域 里 的 
大 多 数 实践 派 都 认为 : 在 软件 工程 产业 中 ， 导 致 花费 增加 和 延期 交付 软件 产品 的 最 主要 原因 是 
缺乏 沟通 以 及 客户 需求 的 变化 。 举 例 来 说 ， 在 地 基 已 经 建 好 的 情况 下 ， 很 少 有 客户 会 坚持 对 楼 
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盘 的 建设 计划 做 大 的 修改 。 但 是 在 许多 组 织 机 构 进 行 扩编 或 变更 的 情况 下 ， 软 件 产 品 交付 使 用 
后 ， 对 软件 系统 的 需求 也 还 是 会 一 直 进 行 下 去 〈 也 就 是 说 ， 软 件 的 需求 不 会 因为 软件 的 交付 使 
用 而 停止 )。 其 原因 可 能 是 公司 决定 把 原本 仅 为 完成 辅助 功能 而 开发 的 软件 系统 推广 到 整个 公 
司 ， 或 者 是 技术 的 进步 取代 了 初始 需求 分 析 阶 段 的 可 行 性 。 软 件 工程 师 已 经 发 现 ， 在 任何 情况 
下 ， 己 项 目的 利益 相关 者 进行 直接 地 、 经 常 性 地 沟通 是 必需 的 。 

2. 设计 

如 示 说 需求 分 析 阶 段 提 供 了 一 个 即将 开发 的 软件 产品 的 描述 ， 那 么 设计 主要 是 为 预期 系统 
的 构建 提出 一 个 解决 方案 。 从 某 种 意义 上 讲 ， 需 求 分 析 阶段 指明 要 解决 的 问题 ， 而 设计 阶段 则 
是 制定 问题 的 解决 方案 。 从 一 个 外 行人 的 视角 来 看 ， 需 求 分 析 阶 段 常常 等 同 于 决定 软件 系统 应 
该 做 学 什么 ， 而 设计 阶段 则 是 决定 系统 怎样 完成 这 些 目 标 。 虽 然 这 种 描述 是 有 意义 的 ， 但 很 多 
钦 件 工程 师 认为 它 是 有 缺陷 的 ， 因 为 实际 上 在 需求 分 析 阶 段 要 详细 说 明 需 求 的 诸多 细节 ， 在 设 
什 阶 段 也 有 很 多 的 细节 设计 要 考虑 。 

软件 系统 的 内 部 结构 在 设计 阶段 被 建立 。 设 计 阶 段 的 结果 是 可 被 转化 为 程序 的 软件 系统 结 
构 的 详细 描述 。 

如 果 项 目 是 为 了 建造 一 座 办 公 大 楼 ， 而 不 是 构建 一 个 软件 系统 ， 那 么 在 设计 阶段 应 该 为 大 
制 定 详细 的 结构 上 的 计划 ， 满 足 指定 需求 。 例 如 ， 这 样 的 计划 应 该 包含 在 各 个 细节 层次 上 措 
述 所 建 大 楼 的 蓝图 汇总 。 正 是 源 于 这 些 文档 ， 实 际 的 大 楼 将 被 建造 。 制 定 这 些 计划 的 技术 已 经 
经 历 多 年 的 发 展 ， 它 包括 标准 的 符号 系统 以 及 大 量 的 建 模 和 图 形 化 方法 学 。 

同样 ， 在 软件 的 设计 中 ， 画 图 和 建 模 也 发 挥 着 很 大 的 作用 。 然 而 ， 软 件 工 程 师 所 用 的 方法 
学 和 符号 系统 与 建筑 领域 里 所 使 用 的 相 比 ， 稳 定性 不 太 好 。 确 实 ， 与 建筑 学 这 个 成 熟 的 学 科 相 
比 ， 软 件 工程 显得 非常 动态 化 ， 因 为 软件 工程 的 研究 人 员 一 直 在 努力 地 寻找 软件 开发 过 程 中 更 
好 的 办 法 。 我 们 将 在 7.5 节 详 细 讨论 当前 的 符号 系统 以 及 与 它们 相关 的 图 形 化 / 建 模 方法 学 。 

3. 实现 

实现 阶段 涉及 程序 的 具体 编写 、 数 据 文件 的 创建 和 数据 库 的 开发 。 在 实现 阶段 ， 我 们 看 到 
了 软件 分 析 员 〈software analyst) 〈 有 时 候 也 称 之 为 系统 分 析 员 ) 和 程序 员 (programmer) 之 间 
的 工作 的 不 同 。 软 件 分 析 员 参与 了 整个 开发 过 程 , 他 的 工作 重点 可 能 在 于 需求 分 析 与 设计 步骤 ， 
而 程序 员 的 主要 工作 是 实现 这 些 步 又。 最 狭义 地 说 ， 程 序 员 负 责 写 程序 来 实现 软件 分 析 员 提 山 
的 设计 。 做 了 这 样 的 区 分 ， 我 们 还 要 注意 的 是 ， 在 计算 机 领域 里 ， 并 没有 一 个 总 的 权威 来 控制 
术语 的 使 用 。 许 多 有 着 软件 分 析 员 头衔 的 人 ， 本 质 上 就 是 程序 员 ， 而 许多 有 着 程序 员 〔 也 许 是 
融 级 程序 员 ) 头衔 的 人 ， 从 完全 意义 上 讲 是 软件 分 析 员 。 我 们 很 快 就 可 以 看 到 ， 术 语 上 的 这 种 
模糊 是 因为 今天 的 软件 开发 过 程 中 的 步骤 经 常会 交 又 重 倒 。 

4. 测试 

在 过 去 传统 的 开发 阶段 中 ， 测 试 本 质 上 等 同 于 调试 程序 和 确认 最 终 的 软件 产品 是 否 与 软件 
需求 规格 说 明文 档 相 一 致 的 过 程 。 但 是 如 今 ， 这 样 的 测试 观念 被 认为 太 过 狭隘 。 程 序 不 仅仅 是 
在 软件 开发 过 程 中 被 测试 的 人 工 产品 ， 实 际 上 整个 开发 过 程 中 的 每 个 中 间 步 骤 都 必须 为 其 精确 
性 进行 测试 。 此 外 ， 我 们 将 在 7.6 节 中 看 到 ， 现 在 测试 被 认为 是 为 了 整个 质量 保证 所 作 努力 中 的 
一 修 部 分 ， 这 一 目标 涂 透 于 整个 软件 生命 周期 。 因 此 ， 很 多 软件 工程 师 认 为 测试 不 应 该 被 看 作 
征 软件 开发 过 程 中 独立 的 一 步 ， 而 是 〈 许 多 的 事例 标明 ) 应 该 纳入 到 其 他 步骤 中 ， 形 成 3 步 开发 
过 程 ， 其 中 每 一 步 都 应 该 有 自己 的 和 名称， 需求 分 析 和 确认 、 设 计 和 验证 以 及 实现 和 测试 。 

遗憾 的 是 ， 经 验 表明 ， 大 型 的 软件 系统 即使 经 过 了 严格 的 测试 ， 还 是 可 能 会 包含 大 量 的 错误 。 
其 中 许多 错误 可 能 在 软件 的 生命 周期 内 都 检测 不 出 来 。 然 而 ， 另 一 些 错误 可 能 会 造成 重大 的 故障 。 
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消除 这 种 错误 是 软件 工程 的 目标 之 一 。 事 实 上 这 些 方法 的 流行 意味 着 还 有 许多 研究 可 以 去 做 。 


问题 与 练习 

1. 软件 生命 周期 的 开发 阶段 是 如 何 影 响 维 护 阶 段 的 ? 

2. 简要 说 明 软 件 生 命 周期 之 开发 阶段 的 4 个 步骤 〈 需 求 分 析 、 设 计 、 实 现 和 测试 ) 。 
3. 试 简 述 软件 需求 规格 说 明文 档 的 作用 。 
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软件 工程 早期 的 方法 强调 以 一 个 严格 的 顺序 ， 按 照 需 求 分析 、 设 计 、 实 现 和 测试 分 阶段 进 
行 。 理 由 是 ， 在 大 型 软件 的 开发 过 程 中 ， 人 允许 做 出 随意 变更 会 冒 太 大 的 风险 。 结果， 软件 工程 
师 坚持 :在 设计 之 前 必须 先 完成 整个 系统 的 需求 分 析 : 同样 ， 设 计 完 成 后 再 开始 实现 。 结 入 产 
生 了 现在 称 为 漫 布 模型 (waterfall model) 的 一 个 软件 开发 过 程 。 推 而 广 之 ， 这 种 开发 过 程 只 会 
按照 一 个 方 问 进行 。 

近年 来 ， 由 瀑布 模型 规定 的 高 度 结构 化 环境 与 “自由 发 挥 ” 的 “ 摸 着 石头 过 河 ” 的 开发 过 
程 之 间 的 矛盾 带 来 了 软件 工程 技术 的 变化 ， 而 后 者 通常 对 创造 性 的 问题 求解 至 关 重 要 。 软 件 开 
发 过 程 中 出 现 的 增 量 模型 (incremental model) 就 说 明了 这 一 点 。 依 据 这 个 模型 ， 所 需 的 软件 系 
统 以 一 种 渐 近 的 模式 来 构建 ， 即 软件 产品 先是 以 功能 有 限 的 简化 版 本 出 现 ， 一 旦 这 个 版 本 的 系 
统 通过 测试 或 经 未 来 用 户 的 评估 ， 更 多 的 功能 就 以 递增 的 方式 加 到 系统 中 ， 然 后 再 测试 ， 直 至 
整个 系统 全 部 完成 。 例 如 ， 为 医院 开发 的 病人 记录 系统 ， 一 开始 系统 只 需要 能 够 查看 整个 记录 
系统 中 的 一 小 部 分 病人 的 记录 样本 就 可 以 了 ， 一 旦 这 个 版 本 的 系统 能 够 工作 ， 其 他 功能 ， 如 增 
加 和 更 新 记录 的 功能 等 ， 就 可 以 以 源 进 的 方式 加 入 到 系统 中 去 。 

另外 一 -种 与 严格 遵循 瀑布 模型 不 同 的 是 选 代 模型 〈iterative model)。 事 实 上， 尽管 它 与 增 量 
模型 是 不 同 的 ， 但 二 者 还 是 非常 相似 〈《 有 时 是 相同 ) 的 。 增 量 模型 使 用 扩展 产品 的 每 个 前 期 版 
本 到 更 大 版 本 的 概念 ， 而 迭代 模型 则 使 用 重建 每 个 版 本 的 概念 。 实 际 上 ， 增 量 模型 通 贡 会 包 合 
一 个 基本 的 迁 代 过 程 ， 而 选 代 模型 常常 导致 增 量 的 结果 。 

一 个 典型 的 从 代 技术 的 例子 是 Rational 软 件 公司 创造 的 统一 软件 开发 过 程 《Rational Unified 
Process，RUP) (RUP， 与 “cup” 押 韵 )， 现 在 这 家 公司 是 IBM 的 一 个 分 公司 。RUP 在 本 质 上 是 
一 种 软件 开发 范 型 ， 它 重新 定义 了 软件 生命 周期 中 开发 阶段 的 每 一 个 步骤 ， 并 提供 执行 这 上 步 
又 的 指导 。 这 些 指 导 ， 连 同 支持 它们 的 CASE 工 具 ， 都 被 IBM 在 市 场 上 交易 。 今 天 ，RUP 在 软件 
领域 被 广泛 地 采用 。 事 实 上 ， 它 的 流行 促进 了 非 专 利 版 本 〈 称 之 为 统一 过 程 《unified process )) 
的 发 展 ， 这 在 非 商业 基础 上 非常 有 用 。 

”” 增 量 模型 和 迭代 模型 反映 出 软件 开发 采用 原型 开发 〈prototyping) 这 样 一 种 趋势 ， 也 束 是 
把 预期 系统 先 做 成 一 个 非 完整 版 本 ， 称 之 为 原型 (Prototype)， 并 加 以 评估 。 在 增 量 模型 中 ， 将 
这 些 原型 发 展 为 一 个 最 终 的 完整 系统 ， 将 这 样 一 个 过 程 称 为 演化 式 原型 开发 〈evolutionary 
prototyping )。 另 外 一 些 情 况 中 ， 原 型 可 能 会 弃 而 不 用 ， 以 使 得 最 后 设计 有 全 新 的 实现 。 这 种 方 
法 称 为 抛弃 式 原 型 开发 〈throwaway prototyping)。 快 速 原型 开发 〈rapid prototyping ) 通 币 属 二 
抛弃 式 原 型 开发 这 个 范畴 。 这 种 方法 中 ， 开 发 过 程 的 早期 ， 就 很 快 构建 一 个 预期 系统 的 简单 原 
型 。 这 个 原型 可 能 只 有 几 个 屏幕 图 像 构成 ， 用 来 演示 系统 是 如 何 与 用 户 交 互 以 及 系统 有 哪些 功 
能 。 其 目标 不 是 做 出 一 个 运行 版 本 的 系统 ， 而 是 作为 一 个 示范 工具 ， 来 理 清 软件 开发 过 程 中 的 
各 个 部 分 相互 交流 的 关系 。 例 如 ， 人 快速 原型 有 利于 在 分 析 阶 段 就 确定 系统 需求 ， 也 能 帮助 在 销 


7.4 模块 化 217 





和 售 期 间 向 潜在 的 客户 进行 推销 介绍 。 

由 计算 机 的 热心 者 /爱好 者 使 用 多 年 的 演化 式 原型 开发 的 一 种 变种 方法 ， 称 为 开放 源码 开发 
(open-source development)。 这 是 今天 许多 自由 软件 开发 采用 的 一 种 方式 。 最 著名 的 例子 也 许 
就 是 Linux 操作 系统 ， 该 系统 的 开放 源码 开发 工作 最 初 是 由 Linus Torvald 完成 的 。 软 件 包 的 开 
放 源 码 开发 遵循 以 下 过 程 : 先是 单个 作者 开发 一 个 初始 版 本 的 软件 〈 通 常 是 完成 该 作者 自己 的 
需求 )， 然 后 将 其 源 代 码 和 相关 文档 发 放 到 因特网 上 ， 其 他 用 户 可 以 免费 下 载 和 使 用 这 个 软件 。 
由 于 这 些 其 他 用 户 拥有 该 软件 的 源 代码 和 相关 文档 , 那么 他 们 就 能 修改 或 增强 这 个 软件 的 功能 ， 
以 着 合 上 月 己 的 需要 ， 或 者 是 改正 他 们 发 现 的 错误 。 接 下 来 ， 他 们 就 将 这 些 改 动 报告 给 原作 者 ， 
原作 者 就 将 这 些 改动 整合 到 系统 中 ， 得 到 软件 的 扩展 版 本 ， 并 可 用 于 更 进一步 的 修改 。 实 际 上 ， 
一 个 星期 肉 ， 软 件 包 就 有 可 能 经 过 几 次 的 扩展 升级 。 

由 洗 布 模型 转化 而 来 的 最 显著 的 方法 就 是 被 称 为 敏捷 方法 〈agile method) 的 方法 学 集合 ， 
它们 都 建议 在 增 量 基础 上 的 早期 和 快速 实现 ， 响 应 需求 变更 ， 降低 严格 需求 规格 说 明和 设计 的 
重要 性 。 敏 捷 方 法 的 一 个 例子 就 是 极限 编程 (XP)。 根 据 XP 模 型 ， 由 少 于 12 个 成 员 组 成 一 个 软 
件 开 有 团队 ， 在 共同 的 工作 场所 自由 地 交换 想法 ， 开 发 项 目 过 程 中 相互 协作 ， 通过 每 天 不 断 重 
复 非 正式 需求 分 析 、 设 计 、 实 现 和 测试 这 样 一 个 周期 开发 过 程 ， 以 增 量 的 方式 开发 软件 。 这 样 ， 
软件 包 的 新 扩展 版 本 呈现 出 一 种 基本 规律 ， 即 每 个 新 版 本 都 能 由 项 目 的 利益 相关 者 进行 评估 ， 
并 以 此 为 基础 做 进一步 的 增 量 。 概 括 说 来 ， 敏 捷 方 法 具有 灵活 性 的 特点 ， 这 与 瀑布 模型 完全 相 
反 。 瀑 布 模型 的 典型 情况 就 是 经 理 和 程序 员 在 各 自 的 办 公 室 工 作 ， 并 严格 地 完成 整个 软件 开发 
任务 中 明确 定义 的 那 部 分 工作 。 

比较 瀑布 模型 与 XP 横 型 中 所 描述 的 差异 ， 揭 示 了 软件 工程 方法 学 的 广度 。 这 些 方法 应 用 于 [3355 
软件 开发 的 过 程 ， 期 待 以 一 种 有 效 的 方式 找到 更 好 的 方法 来 构建 可 靠 的 软件 。 这 个 领域 的 研究 
仍 在 继续 。 虽 然 取 得 了 一 定 的 进展 ， 但 还 有 许多 工作 要 做 。 


问题 与 练习 

1. 概述 软件 开发 的 传统 江 布 模型 与 较 新 的 增 量 和 选 代 范 型 之 间 的 区 别 。 

2. 人 出 3 种 与 严格 遵循 半 布 模型 不 同 的 开发 范 型 。 

3,， 传统 的 省 化 式 原 型 开发 与 开放 源码 开发 的 方法 之 间 的 区 别 是 什么 ? 

4 对 于 通过 开放 源码 方法 开发 的 软件 的 所 有 权 而 言 ， 你 认为 可 能 会 出 现 4 么 样 的 潜在 问题 ? 


7.2 世 中 有 一 名 关键 性 的 陈述 : 要 修改 软件 ， 就 必须 理解 这 个 程序 ， 或 者 至 少 是 与 这 个 程序 
相关 的 那 部 分 。 即 使 是 小 程序 ， 要 想 达到 这 样 的 理解 也 是 相当 困难 的 ; 而 对 于 大 型 的 软件 系统 ， 
如 条 没 有 模块 化 ， 那 几乎 是 不 可 能 的 。 模 块 化 (modularity)， 就 是 把 软件 分 割 成 几 个 易于 处 理 
的 单元 ， 通 常 称 为 模块 (module)， 每 个 模块 仅仅 承担 整个 软件 的 -一 部 分 功能 。 


7.4.1 模块 的 实现 


个 块 可 以 以 不 同 的 方式 实现 。 我 们 已 经 看 到 (第 5 章 和 第 6 章 )， 在 命令 型 范 型 的 环境 中 ， 
使 执 表现 为 过 程 。 与 之 对 应 的 是 ， 面 向 对 象 范 型 则 是 利用 对 象 作为 其 基本 的 模块 要 素 。 这 些 差 
别 非 常 重要， 因为 它们 决定 了 最 初 的 软件 设计 过 程 中 的 潜在 目标 。 这 个 目标 是 将 全 部 工作 表示 
为 个 别 的、 易于 管理 的 过 程 ， 还 是 确定 系统 中 的 对 象 并 理解 它们 之 间 是 如 何 相互 作用 的 ? 
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现实 世界 中 的 软件 工程 


以 下 情节 是 现实 世界 的 软件 工程 所 面临 的 典型 问题 . XYZ 公 司 聘 请 一 家 软件 工程 公司 为 其 
开发 、 安 装 一 套 全 公司 的 集成 软件 系统 ,以 满足 公司 的 数据 处 理 需要 . 作为 系统 的 一 部 分 , XYZ 
公司 又 开发 了 一 套 PC 机 网 络 系统 ， 用 来 给 员工 访问 这 个 全 公司 系统 。 这样， 每 个 员工 的 办 公 果 
上 就 有 一 台 PC 机 。 很 快 这 些 PC 机 不 仅 能 用 来 访问 新 的 数据 管理 系统 ， 而 且 可 以 作为 可 定制 的 
工具 ， 员 工 用 其 来 提高 自己 的 工作 产 出 。 例 如 ， 某 个 员工 可 以 开发 一 个 电子 制 表 程 序 来 提高 工 
作 效 率 。 不 幸 的 是 ， 这 样 一 个 定制 的 应 用 可 能 设计 并 不 完善 ， 或 者 没有 经 过 彻底 的 测试 ， 因 而 
可 能 会 包括 一 些 员 工 并 不 能 完全 理解 的 特性 。 随 着 年 限 的 增加 ， 这 些 定制 的 应 用 程序 慢 慢 会 融 
含 到 公司 的 内 部 事务 处 理 过 程 中 。 与 此 同时 ， 当 和 初 开发 这 些 应 用 程序 的 员工 可 能 会 升迁 、 幸 任 
或 者 会 离开 这 休 公 司 ， 可 是 使 用 这 些 程序 的 其 他 同事 却 并 不 懂 这 些 程序 。 结果， 起 初 的 一 个 精 
心 设计 、 协 调 一 致 的 系统 变 成 了 一 个 设计 差 、 无 文档 的 、 出 错 频 艾 的 拼凑 品 。 


为 了 说 明 这 一 点 ， 我 们 来 考虑 用 命令 型 范 型 和 面向 对 象 范 型 是 如 何 开发 一 个 模拟 网 球 比赛 
的 简单 程序 模块 的 。 在 命令 型 范 型 中 ， 我 们 首先 考虑 的 是 肯定 会 发 生 的 动作 。 由 于 每 场 网 球 比 
赛 都 是 从 一 名 选手 发 球 开 始 , 所 以 我 们 可 以 考虑 构造 名 为 Serve 的 过 程 ( 这 是 基于 选手 的 特性 ， 
也 许 是 一 个 概率 点 )， 用 来 计算 球 的 初始 速度 和 方向 。 接 下 来 ， 我 们 需要 确定 球 的 路 径 《 是 否 撞 
在 网 上 ? 弹 回 到 什么 地 方 ? )。 我 们 可 以 把 这 些 计 算 放 在 另外 一 名 为 ComputePath 的 过 程 中 。 
下 一 步 可 能 就 要 确定 另外 一 个 选手 是 否 能 击 回 这 个 球 。 如 果 能 够 击 回 这 个 球 ， 我 们 还 必须 计算 
球 的 新 的 速度 和 方向 ， 可 以 把 这 些 计算 放 在 名 为 Return 的 过 程 中 。 

照 这 样 继续 ， 我 们 可 以 构造 出 如 图 7-3 所 示 的 结构 图 〈stmucture chart) 所 描述 的 模块 结构 。 在 这 
个 图 中 ， 过 程 用 抢 形 表示 ， 过 程 之 间 的 依赖 关系 〈 由 过 程 调用 来 实现 ) 用 稍 头 表示 。 特 别 是 ， 这 个 图 
表明 了 整个 比赛 是 由 名 为 ControlGame 的 一 个 过 程 来 控制 的 。 为 了 完成 这 个 工作 ，Ccontro1LGame 
过 程 又 调用 了 server、Return、computePath 和 UpdateScore 这 4 个 过 程 服 务 的 。 


ControlGarne 
本 一 


是 宣 E 
Serve Return CormpuatePath 避 pdateScore 


图 7-3 ”一 个 简单 的 结构 图 


注意 ， 这 个 结构 图 中 并 没有 描述 每 个 过 程 是 如 何 完成 自己 的 工作 的 ， 确 切 地 说 ， 这 个 图 仅 
仅 是 确定 了 过 程 并 描述 了 过 程 之 间 的 依赖 关系 。 事 实 上 ，controlGame 过 程 会 匈 调 用 Serve 
过 程 来 完成 自己 的 工作 ， 然 后 重复 调用 computePath 过 程 和 Return 过 程 ， 直 到 有 一 名 选手 
没有 击 中 球 为 止 。 最 后 ， 再 调用 serve 过 程 再 重复 以 上 整个 过 程 之 前 ， 调 用 UpdaateScore 这 
个 过 程 的 服务 来 更 新 比分 。 

至 此 ， 我 们 仅仅 是 获得 了 所 需 系 统 的 一 个 框架 ， 但 思路 已 经 建立 起 来 了 。 按 照 命 令 型 范 型 ， 
通过 构思 系统 必须 实现 的 功能 ， 我 们 已 经 完成 了 程序 的 设计 ， 因 而 得 到 了 设计 方案 ， 其 中 ， 模 
块 就 是 过 程 。 

现在 ， 我 们 重新 考虑 这 个 程序 的 设计 ， 而 这 次 是 在 面 问 对象 范 型 的 环境 中 考虑 的 。 我 们 开 
始 的 想法 就 是 用 两 个 对 象 来 表示 两 位 选手 ， 即 Blayera 和 PlayerB。 这 些 对 象 将 有 同样 的 功能 
和 不 同 的 属性 .。《 两 名 选手 应 芒 都 能 发 球 和 回击 球 ， 但 是 其 技巧 和 力度 不 同 。) 这 样 ， 这 些 对 象 
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就 是 同一 个 类 的 实例 。 我 们 把 这 个 类 称 为 PlayerClass, 该 类 包含 了 Serve 方 法 和 Return 方 法 ， 
用 来 模拟 选手 的 相应 动作 。 这 个 类 中 还 包括 了 选手 的 内 部 属性 〈 如 技能 和 醒 力 等 )， 这 些 属性 的 
值 反 映 了 选手 的 特征 。( 我 们 需要 指出 的 是 ， 当 产生 一 个 选手 对 象 时 ， 就 可 以 通过 构造 器 来 对 这 
些 属 性 进行 初始 化 。) 到 目前 为 止 ， 可 以 用 图 7-4 来 表示 我 们 的 设计 结果 。 从 图 中 可 以 看 出 ， 

Plavera 和 PlayverB 是 PlaverClass 类 的 两 个 实例 ， 而 这 个 类 包含 了 Skil1L1 属 性 和 Endurance 
属性 ， 同 时 也 包含 了 serve 方 法 和 returnVolley 方 法 。( 注 意 ， 在 图 7-4 中 我 们 已 经 用 下 划 线 标 
注 出 对 象 的 名 称 ， 以 此 来 区 分 它 与 类 的 名 称 。) 


对 志 
Playerclass 
实例 PlaverA 
三 “二 长 则 -一 
” 属性 二 
enduranice iD 
实例 Flayvere 
Serve 
户 潜 一 
Peturm VolEy 


图 7-4 PlaverClass 类 和 它 的 实例 的 结构 


接 下 来 ， 我 们 需要 一 个 对 象 ， 来 实现 截 判 的 功能 ， 即 判定 选手 完成 的 动作 是 否 合 乎 规则 。 
例如 ， 发 球 是 否 过 网 ? 球 是 否 落 在 球场 的 合适 位 置 内 ? 为 此 ， 我 们 可 能 要 建立 一 个 名 为 Judge 
的 对 象 ， 该 对 象 包 含 evaluateServe 方 法 和 evaluateReturn 方 法 。 如果 Judage 对 象 判 定 发 球 
或 回 球 合乎 规则 ， 和 那么 比赛 继续 ， 否 则 ，Juase 对 象 会 给 另 一 个 名 为 Score 的 对 象 发 消息 ， 千 
之 记录 下 相应 的 结 未 。 

在 这 点 上 ， 网 球 程序 的 设计 包括 4 个 对 象 ， Playera、PlayerB、Judge 和 Score。 为 了 说 
明 我 们 的 设计 ， 考 虑 在 排球 比赛 中 可 能 发 生 的 事件 序列 (如 图 7-$ 所 示 )， 图 中 对 象 以 方 框 的 形 陈 
来 表示 。 这 个 图 是 要 把 对 象 之 间 的 通信 表示 成 调用 对 象 Playera 中 的 serve 方 法 的 结果 。 当 我 
们 从 上 向 下 看 图 时 ， 事 件 按 次 序 发 生 。 就 如 同 第 一 个 水 平 箭头 所 表示 的 那样 ，PLayera 通 过 调 
用 evaluateServe 方 法 向 对 象 Judge 报 告 它 的 发 球 。 对 象 Judqge 然 后 决定 发 球 是 否 有 效 ， 并 且 
通过 调用 PlayerB 的 returnVolley 方 法 请 求 PlaverB 回 球 。 当 Judge 判 定 Playera 产 生 错 误 ， 
并 且 请 求 Score 对 象 记 录 下 结果 时 ， 排 球 比 赛 结 柬 。 


Playver A Player 日 Judge 号 局 
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方法 evaluateServe 1 SuvalutaeRetumm  ! 
本 


有 人 | 
returnVolley 


人 


| ] 
evalutaeRhetum | 


| 

| updateScore 
目 上 

下 

下 上 


图 7-5 ”由 PlayerA 的 Serve 产 生 的 对 象 间 的 变 互 
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和 命令 型 范 型 例子 的 情况 一 样 ， 面 向 对 象 程序 也 是 非常 简单 。 然 而 ， 我 们 已 经 取得 了 很 六 
的 进步 ， 能 够 很 清楚 地 理解 面向 对 象 模式 下 是 如 何 进行 模块 化 设计 的 ， 而 在 此 模块 化 设计 中 ， 
其 基本 的 构件 就 是 对 象 。 


7.4.2 耦合 


通过 前 面 的 介绍 ， 我 们 知道 ， 模 块 化 是 开发 出 易于 管理 的 软件 的 一 条 途径 。 其 基本 思想 是 ， 
以 后 的 任何 修改 可 能 只 会 涉及 少数 几 个 模块 , 允许 个 人 对 系统 的 修改 只 集中 在 系统 的 有 关 部 分 ， 
而 不 是 整个 系统 。 当 然 ， 这 里 有 个 前 担 ， 就 是 对 一 个 模块 的 修改 不 会 无 意 中 影响 到 系统 的 其 他 
模块 。 因 此 ， 当 设计 一 个 模块 化 系统 的 时 候 ， 其 目标 就 应 该 是 做 到 模块 之 间 的 最 大 独立 性 ， 或 
者 换 名 话说， 就 是 使 模 甘 之 间 的 联系 尽 可 能 少 。 这 种 联系 称 之 为 模块 之 间 的 耦合 〈coupling)。 
事实 上 ， 用 来 衡量 软件 系统 复杂 度 〈 并 且 这 样 就 获得 了 一 种 估算 维护 软件 系统 的 所 需 的 开销 ) 
的 一 个 指标 就 是 度量 该 系统 的 模块 间 的 耦合 。 

模块 间 的 耦合 出 现 了 几 种 形式 。 一 种 是 控制 耦合 〈control coupling)， 出 现在 一 个 模块 传递 
控制 信息 来 控制 另外 一 个 模块 执行 时 ， 如 过 程 调用 的 情况 ， 图 7-3 里 的 姑 构图 束 表 示 了 存在 于 
过 程 之 间 的 控制 耦合 。 具 体 来 说 ， 从 controlGame 模块 到 serve 模块 之 间 的 箭头 说 明了 前 者 
传递 了 对 后 者 的 控制 。 图 7-5 中 的 协作 图 也 代表 了 一 个 控制 耦合 的 情况 ， 图 中 的 箭头 所 描绘 的 
路 径 就 代表 了 控制 信息 在 对 象 之 间 的 传递 。 

模块 间 的 另 一 种 形式 的 耦合 是 数据 炮 合 〈data coupling)， 这 是 指 模块 加 的 数据 共享 。 如 果 
两 个 模块 是 通过 共享 同一 个 数据 项 而 相互 作用 的 ， 那 么 当 对 一 个 模块 进行 修改 时 ， 可 能 会 影响 


.到 另外 一 个 模块 ， 并 且 对 数据 本 身 格式 的 修改 在 这 两 个 模块 中 都 会 有 反映 。 


过 程 问 的 数据 耦合 出 现 了 两 种 形式 。 一 种 是 以 参数 的 形式 从 一 个 过 程 到 另 一 个 过 程 进 行 显 
式 的 数据 传送 。 这 种 耦合 在 结构 图 中 是 这 样 表示 的 ， 即 用 过 程 之 间 的 箭头 作为 标签 来 指示 数据 
的 传送 。 稍 头 的 方向 表明 在 此 方向 上 进行 数据 项 的 传送 。 例 如 ， 图 7-6 是 图 7-3 的 扩展 版 本 ， 
在 此 图 中 , 我 们 可 以 看 出 当 controlGame 过 程 调用 serve 过程 时 ，controlGame 过 程 会 将 需 
要 模拟 的 那 位 选手 的 属性 告知 给 Serve 过 程 。 当 serve 过 程 完 成 后 ， 它 就 将 球 的 轨迹 报告 给 
controlGame 过 程 。 
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独 7-6 包 全 数据 和 不 合 的 一 个 络 爸 久 


类 似 的 数据 耦合 也 发 生 在 面 癌 对 象 设 计 中 的 对 象 之 间 。 例 如 , 当 Plavera 对 象 请 求 Judage 
对 象 对 其 发 球 进 行 判定 时 〈 见 图 7-5)， 和 饭 必须 将 球 的 轨迹 信息 传递 给 Judge 对 象 。 另 一 方面 ， 
面向 对 象 设计 模式 的 一 个 优势 就 在 于 它 从 本 质 上 将 对 象 之 间 的 数据 耦合 减 小 到 最 低 。 这 是 因为 
对 象 的 方法 易于 包括 对 象 内 部 数据 的 处 理 过 程 。 例 如 ，Playera 对 象 将 包括 该 对 象 的 有 关 属 性 
信息 和 针对 这 些 信息 的 处 理 方 法 。 那 么 就 没有 必要 将 这 些 信 息 传 递 给 另外 一 个 对 象 ， 人 对 
象 之 间 的 数据 耦合 就 能 达到 最 小 。 

与 通过 参数 进行 明显 的 数据 传递 方式 不 同 的 是 ， 数 据 可 以 以 一 种 隐 式 的 全 局 数据 《global 
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data) 的 形式 在 模块 之 间 进 行 共享 。 全 局 数据 是 可 以 自动 地 被 整个 系统 中 的 所 有 模块 使 用 的 数 
据 项 。 这 与 局 部 数据 项 不 同 ， 局 部 数据 项 只 能 在 某 个 特定 的 模块 中 使 用 ， 除非 明确 地 传递 给 了 
另外 一 个 模块 。 大 多 数 高 级 语言 提供 了 全 局 数据 和 局 部 数据 的 实现 方法 ， 但 是 对 全 局 数据 的 使 
用 应 当 谨 慎 。 全 局 数据 使 用 的 问题 在 丁 ， 如 果 基 个 人 试图 修改 依赖 于 全 局 数据 的 一 个 模 其 ， 那 
入 他 就 很 难 确定 正 被 修改 的 模块 与 其 他 模块 之 间 有 怎样 的 相互 关系 。 简 而 言 之 ， 全 局 数据 的 使 
用 降低 了 模块 作为 一 种 抽象 工具 的 使 用 价值。 


7.4.3 ”内 娶 


正如 模块 间 的 耦合 应 最 小 化 ， 同 样 重要 的 是 ， 每 个 模块 的 内 部 绑 定 程度 应 该 最 大 化 。 术 语 
内 聚 (cohesion) 就 用 来 表示 这 种 内 部 绑 定 ， 或 者 说 ， 模块 内 部 各 部 分 的 关联 程度 。 为 充分 理解 
内 聚 的 重要 性 ， 必须 考察 系统 的 最 初 开发 并 考虑 这 个 软件 的 生命 周期 。 如 果 有 必要 在 模 据 中 做 
出 修改 ， 那么 存在 于 模块 中 的 各 种 不 同 的 活动 会 搅乱 原本 简单 的 一 个 过 程 。 所 以 ， 软件 设计 人 
员 在 寻求 模块 间 的 低 耦 合 的 同时 ， 还 力求 做 到 模块 内 部 的 丙 内 过 。 

一 种 内 娶 度 较 弱 的 内 聚 形式 称 为 逻辑 内 聚 〈logical cohesion)。 模 块 内 的 逻辑 内 聚 是 由 其 内 
部 元 素 本 质 上 实现 逻辑 上 相似 的 活动 所 引起 的 。 例 如 ， 考虑 一 个 模块 ， 它 完成 整个 系统 与 外 从 
进行 通信 的 功能 。 粘 合 这 个 模块 的 “胶水 ” 是 模块 中 用 以 处 理 通信 的 所 有 活动 。 然 而 ， 通 信和 的 
主题 各 不 相同 ， 有 的 可 能 是 用 来 获取 数据 ， 有 的 可 能 是 用 来 报告 钳 误 。 

一 种 内 聚 度 较 强 的 内 聚 形 式 称 为 功能 内 聚 (functional cohesion )。 这 就 表示 模块 中 所 有 部 分 都 
集中 国 绕 着 完成 某 一 项 功能 。 在 命令 型 范 型 的 设计 中 ， 如 果 把 模块 的 子 任务 独立 在 其 他 模块 中 ， 
并 将 这 些 模块 用 作 抽 象 工具 ， 那 么 该 模块 的 功能 内 聚 的 程度 通 弟 会 者 强 。 这 一 点 在 模拟 网 球 比赛 的 
例子 中 得 到 了 很 好 的 说 明 〈 参 见 图 7-3)。 在 该 图 中 ， controlGame 横 块 将 其 他 模块 用 作 抽 徐工 具 ， 
以 便 它 能 集中 调度 整个 比赛 ， 而 不 是 把 精力 分 散在 实现 发 球 、 回 接 球 和 维护 比分 这 样 的 细节 上 。 

在 面向 对 象 设计 中 ， 由 于 对 象 中 的 方法 常常 松散 地 执行 相关 的 活动 ， 其 唯一 的 共同 约束 就 
是 它们 都 是 由 同一 个 对 象 执 行 的 活动 ， 所 以 全 部 的 对 象 通常 在 逻辑 上 内 聚 。 例 如 ， 在 模拟 网 球 
比赛 的 例子 中 ， 每 个 选手 对 象 包含 的 方法 ， 如 发 球 和 回 接 球 ， 这 些 方法 是 明显 不 同 的 活动 ， 所 
以 这 样 一 个 对 象 仅 仅 是 在 逻辑 上 内 聚 的 模 氛 。 然 而 ， 软件 设计 人 员 应 当 力 求 做 到 使 一 个 对 象 中 
的 每 个 方法 都 在 功能 上 内 聚 。 也 就 是 说 ， 即使 对 象 在 整体 上 仅仅 是 还 辑 上 内 聚 ， 而 对 象 里 的 每 
个 方法 应 当 只 实现 功能 内 聚 的 任务 《参见 冬 7-7)。 


对 对 





对 象 中 每 个 方法 
7 都 在 功能 上 上 向 肾 


图 7-7 ”一 个 对 象 的 逻辑 内 聚 和 功能 内 案 


1 
二 > 
上 
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7.4.4 信息 隐藏 


信息 降 藏 (information hiding) 是 好 的 模块 设计 的 一 个 基本 特征 ， 它 指 的 是 限制 软件 系统 的 
指定 部 分 的 信息 。 这 里 的 术语 信息 应 该 从 广义 阐释 ， 它 包括 关于 程序 单元 结构 和 内 容 的 任何 知 
识 。 这 样 它 包 括 数据 、 用 到 的 数据 结构 类 型 、 编 码 系统 、 模 块 的 内 部 组 成 结构 、 过 程 单元 的 逻 
辑 结构 和 任何 涉及 模块 内 部 特性 的 因 勾 。 

信息 隐藏 的 关键 就 是 阻止 模块 的 动作 ， 使 其 不 会 对 其 他 模块 产生 不 必要 的 依赖 或 影响 。 否 
则 ， 就 有 可 能 导致 模块 产生 错误 ， 这 些 错误 可 能 是 在 其 他 模块 的 开发 中 带 来 的 ， 亦 或 是 在 软件 
维护 期 间 不 正确 的 维护 带 来 的 。 例 如 ， 如 果 一 个 模块 不 限制 其 他 模块 对 其 内 部 数据 的 使 用 ， 那 
么 这 些 数 据 可 能 就 会 被 其 他 模块 破坏 。 或 者 ,如果 设计 一 个 模块 以 利用 另 一 个 模块 的 内 部 结构 ， 
如 果 其 内 部 结构 被 修改 了 ， 随 后 它 将 产生 错误 。 

要 注意 到 信息 隐藏 具有 两 个 化 身 ， 这 是 非常 重要 的 。 一 个 是 作为 设计 目标 的 ， 另 一 个 是 作 
为 实现 目标 的 。 应 当 设计 一 个 模块 ， 以 便于 其 他 模块 不 需要 读 取 它 的 内 部 信息 ， 和 并 且 应 当 以 加 
固 模 块 边界 的 方式 实现 一 个 模块 。 前 者 的 例子 是 最 大 化 内 聚 和 最 小 化 耦合 。 后 者 的 例子 涉及 局 
部 变量 、 应 用 封装 和 使 用 完善 定义 的 控制 结构 。 

最 后 ， 我 们 应 该 注意 到 信息 隐藏 是 抽象 主题 和 抽象 工具 使 用 的 中 心 。 实 际 上 ， 抽 象 工具 的 
概念 是 “ 黑 僵 ”的 概念 ， 用 户 可 以 忽略 它 的 内 部 特性 ， 这 样 就 允许 用 户 集中 考虑 手头 更 大 的 应 
用 。 在 这 种 情况 下 ， 信 息 隐 藏 相当 于 封装 抽象 工具 的 概念 ， 就 像 安 全 单 可 以 用 来 防护 电子 设备 
复杂 的 、 洪 在 的 风险 一 样 。 保 护 他 们 的 用 户 远离 内 部 危险 ， 同 样 也 保护 内 部 ， 以 防 来 目 其 他 用 
户 的 侵扰 。 


7.4.5 构件 


我 们 已 经 注意 到 ， 软 件 工程 领域 里 的 一 个 障碍 就 是 缺乏 预制 的 现成 构件 块 来 构建 大 型 的 软 
件 系 统 。 在 这 一 点 上 上， 软件 开 发 中 的 模块 化 方法 让 我 们 看 到 了 希望。 特别 是 ， 面 癌 对 象 程 序 说 
计 范 型 显得 尤其 有 用 。 这 是 因为 对 银 构 成 了 完备 的 、 自 我 包含 的 单元 ， 这 些 单元 明确 定义 了 与 
其 外 部 环境 的 接口 。 一 旦 对 象 〈 更 准备 地 说 ， 是 一 个 类 ) 设计 成 能 完成 某 种 特定 功能 时 ， 它 就 
可 以 在 任何 要 求 提 供 这 种 服务 的 程序 中 用 来 实现 这 个 功能 。 此 外 ， 继 承 提供 了 一 种 对 预制 对 刍 
的 定义 进行 精炼 的 方法 ， 在 这 种 情况 下 ， 这 些 定义 可 以 定制 成 符合 一 个 特定 应 用 的 需要 。 

于 是 ， 面 向 对 象 编程 语言 C++、Java 以 及 C# 都 伴随 有 一 组 预制 的 “模板 ”， 这 一 操 就 不 正 
为 奇 了 。 通 过 这 些 模 板 ， 程 序 员 可 以 很 方便 地 实现 对 象 并 用 来 完成 特定 功能 。 上 具体 来 说 ，C++ 
拥有 C++ 标准 模板 库 ，Java 编程 环境 伴随 有 Java 应 用 编程 接口 (API)，C# 程 序 员 可 以 访问 .NET 
框架 类 库 。 

对 象 和 类 有 可 能 为 软件 设计 提供 预制 的 构建 块 , 但 是 它们 还 不 太 完 美 。 一 个 问题 是 它们 
提供 了 相对 较 小 的 模块 来 构建 系统 。 所 以 ， 对 象 实际 上 是 更 通用 的 构件 (component) 概念 
中 的 一 个 特例 ,通过 定义 构件 就 能 作为 软件 的 一 个 可 复 用 单元 。 实际 上 ,大 多 数 构 件 都 是 基 
于 面向 对 象 范 型 的 ,并 且 表 现 为 一 个 或 多 个 对 银 组 成 的 集合 的 形式 ， 其 功能 是 作为 一 个 目 包 
含 单元 。 

构件 的 开发 和 利用 的 研究 导致 了 另 一 称 为 构件 构架 (component architecture) (也 就 是 通常 
所 说 的 基于 构件 的 软件 工程 ) 的 领域 的 出 现 。 在 此 领域 中 ， 传 统 的 程序 员 被 构件 装配 员 
(component assembler) 所 代替 ， 由 构件 装配 员 把 预制 的 构件 装配 成 软件 系统 。 在 许多 开发 环 
境 中 ， 常 常用 图 形 界面 中 的 图 标 来 表示 预制 的 构件 。 构 件 装 配 员 并 不 涉及 构件 内 部 的 编程 ， 他 
的 方法 就 是 在 预先 定义 好 的 构件 集合 中 选择 相关 的 构件 ， 然 后 将 它们 进行 最 小 化 的 定制 连接 ， 
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从 而 获得 所 需要 的 功能 。 确 实 ， 一 个 设计 好 的 构件 的 属性 就 是 不 需要 经 过 内 部 的 修改 就 可 以 进 
行 扩展 ， 来 包含 一 些 针 对 特定 应 用 的 特性 。 

Sun 公司 和 微软 公司 都 为 软件 装配 员 提供 了 构建 软件 的 工具 。 在 Sun 公司 的 产品 中 ， 构 件 
称 为 Java Beans， 这 与 Java 编程 语言 赖 以 命名 的 Java 主题 保持 一 致 。 敏 软 公司 的 方法 则 是 包含 
在 称 为 .NET ( 读 作 “dot-NET”) 的 软件 开发 环境 里 。 


问题 与 练习 

| 小 说 与 百科 全 书 在 其 单元 (如 章 、 节 以 及 条 目 ) 之 间 在 耦合 程度 方面 有 什么 不 同 ? 内 聚 方面 呢 ? 

2 -项 体育 活动 通常 划分 为 一 些 单元 。 例 如 ， 篮 球 比赛 被 分 成 了 几 个 回合 ， 网 球 比赛 被 分 成 了 几 届 。 试 

分 析 这 些 模块 之 间 的 耦合 。 这 些 单元 的 内 聚 到 了 怎样 的 程度 ? 

3. 最 高 程度 的 内 聚 与 最 小 程度 的 耦合 的 目标 是 否 一 致 ? 也 就 是 说 ， 随 着 内 聚 度 的 增加 ， 耦合 度 会 相应 降 
低 吗 ? 

4. 定义 耦 人 台 、 内 聚 和 信息 隐藏 。 

5. 扩展 图 7-3 中 的 结构 图 ， 使 其 包括 ControlGame 与 UpdateScore 模 氛 之 间 的 数据 耦合 。 

. 如果 Blavera 的 发 球 违反 排球 比赛 规则 被 视 为 无 将， 绘制 一 幅 类 似 于 图 7-5 的 图 ， 表 示 发 生 的 事件 序 
列 。 

7. 传统 的 程序 员 与 构件 装配 员 之 间 有 什么 区 别 ? 


Ch 





站 
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本 节 里 ， 我 们 研究 一 些 在 软件 开发 的 分 析 与 设计 阶段 使 用 过 的 建 模 技术 和 符号 系统 。 软 件 
工程 学 科 中 以 命令 型 范 型 为 主导 的 年 代 里 ， 这 些 技术 已 经 有 所 发 展 了 。 当 然 ， 在 面向 对 象 范 型 
环境 中 ,也 找到 了 一 些 有 用 的 功能 。 当 另外 的 一 些 如 结构 图 〈 见 图 7-3) 是 专门 用 于 命令 型 范 型 
中 的 。 我 们 开始 考虑 一 些 从 命令 型 范 型 发 展 而 来 的 技术 ， 然 后 将 其 移植 到 研究 面向 对 象 的 工具 
和 扩展 设计 模式 的 功能 上 。 


系统 设计 的 悲剧 

对 系统 完善 设计 的 严格 要 求 可 以 通过 一 个 例证 得 到 说 明 ， 这 就 是 Therac-25 ( 20 世 纪 80 年 
代 中 期 ， 医 学 界 使 用 的 一 台 基 于 计算 机 技术 的 电子 加 速 放 射 治疗 仪 ) 所 遇 到 的 问题 ， 该 机 器 
的 设计 缺陷 导致 了 6 例 放 射 过 量 的 事件 发 生 ， 其 中 3 例 导 致 人 员 的 死亡。 设计 的 缺陷 包括 ; (1) 
机 器 界面 设计 的 不 合理 ， 使 得 操作 员 在 机 器 的 放射 量 调整 到 合适 值 之 前 就 能 进行 放射 操作 ， 
(21 硬件 与 软件 的 设计 之 间 的 协作 性 差 ， 结 果 就 导致 了 某 些 安 全 性 能 的 失效 。 

在 一 些 更 近 的 例子 中 ， 有 固 设计 不 当 导 致 大 面积 停电 、 电 话 服务 中 断 、 金融 业务 的 重大 
错误 、 空 间 探 测 器 的 失踪 以 及 因特网 的 疗 瘘 等 。 如 果 你 想 对 这 个 问题 了 解 更 多 ， 请 查阅 风险 
论坛 【 它 的 网 址 是 httDp:/Aecatless.ncl.ac.uKkK/Risks ) 


7.5.1 较 老 的 工具 
尽管 命令 型 范 型 致力 于 依据 过 程 来 构建 软件 ， 但 确定 这 些 过 程 的 方法 是 考虑 被 操作 数据 ， 


而 不 是 过 程 本 身 。 其 思路 是 ， 研 究 数据 在 系统 中 是 如 何 进行 流动 ， 确 定 在 某 些 点 上 ， 数 据 格 却 
是 否 改 变 ， 或 者 数据 的 路 径 是 合并 还 是 拆 分 。 接 下 来 ， 就 确定 这 些 点 的 位 置 上 有 什么 梓 的 处 理 


224 第 7 章 软件 工程 
发 生 ， 这 样 一 来 ， 通 过 数据 流 的 分 析 就 能 确定 过 程 。 数 据 流 图 〈dataflow diagram) 是 表示 从 数 
据 流 分 析 过 程 中 所 获得 的 信息 的 一 种 方法 。 在 数据 流 图 中 ， 箭 头 表 示 数 据 路 径 ， 椭 圆 表示 数据 
操纵 发 生 的 地 点 ， 和 矩形 表示 数据 源 和 数据 存储 。 作 为 一 个 示例 ， 图 7-8 表示 的 是 医院 账单 系统 
的 一 个 基本 的 数据 流 图 。 注 意 ， 该 图 表明 Payments (从 病人 中 流出 的 ) 和 PatientRecoras 
(从 医院 文件 中 流出 ) 在 椭圆 ProcessPayments 处 合并 ， 并 从 此 处 将 UpaateRecords 流 回 
到 医院 文件 。 
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图 7-8 ”一 个 简单 的 数据 流 图 


数据 流 图 不 仅 能 在 软件 开发 的 设计 阶段 帮助 确定 过 程 ， 还 有 助 于 在 分 析 阶 段 获得 对 预期 系 
统 的 充分 理解 .实际 上 ， 构 建 数据 流 图 可 以 作为 一 种 用 来 改善 客户 与 软件 工程 师 之 间 的 交流 的 
方法 〈 因 为 软件 工程 师 一 直 为 理解 客户 需要 什么 以 及 客户 努力 描述 的 个 人 愿望 而 努力 )， 所 以 ， 
即使 在 命令 型 范 型 已 经 不 太 流 行 的 情况 下 ， 这 些 数据 流 图 还 有 其 应 用 铁 俯 。 

软件 工程 师 已 经 用 了 很 多 年 的 另 一 种 工具 就 是 数据 字典 (data dictionary )， 它 是 关于 整个 软 
件 系 统 中 出 现 的 数据 项 的 一 个 中 央 信息 库 。 这 些 信息 包括 : 为 引用 每 个 数据 项 所 采用 的 标识 符 ， 
每 个 数据 项 里 的 有 效 条 目的 构成 情况 〈 数 据 项 一 直 是 数字 型 的 或 者 一 直 是 字符 型 的 ? 分 配给 该 
数据 项 的 值 的 可 能 范围 是 什么 ? ),， 数据 项 存放 在 什么 地 方 〈 数 据 项 是 存放 在 文件 中 还 是 在 数据 


' 库 中 ? 如 果 是 这 样 的 ， 具 体 在 哪 一 个 里 面 ? )， 软 件 在 什么 地 方 会 引用 这 些 数据 项 哪些 模块 需 


要 数据 项 的 信息 ? )。 
构建 数据 字典 的 一 个 目标 是 ， 增 强 软件 系统 的 潜在 利益 相关 者 与 软件 工程 师 之 间 的 沟通 ， 

并 由 软件 工程 师 负 责 将 利益 相关 者 的 需求 转化 为 需求 规格 说 明文 档 。 在 构建 数据 字典 的 环境 下 ， 
这 样 有 助 于 确保 这 样 一 个 事实 ， 即 如 果 部 分 数字 不 是 真正 的 数字 型 的 ， 那 么 在 软件 的 分 析 阶 段 
就 可 以 发 现 ， 而 不 用 等 到 在 后 面 的 设计 和 实现 阶段 才 发 现 这 个 问题 。 构 建 数据 字典 的 另 一 目标 
是 确立 整个 系统 的 一 臻 性。 借助 构建 字典 时 常常 会 引起 元 余 和 自 相 矛盾 。 例 如， 一 个 数据 项 在 
库存 记录 中 称 为 PartNumber， 而 在 销售 记录 中 可 能 就 改称 为 PartIda。 还 有 ， 在 人 事 部 门 可 
能 会 用 Name 这 个 术语 来 表示 一 名 员工 ， 而 在 库存 记录 中 可 能 用 来 表示 一 个 雪 件 。 


7.5.2 统一 建 模 语言 


数据 流 图 以 及 数据 字典 是 在 面向 对 象 范 型 出 现 以 前 ， 软 件 工程 领域 发 展 比较 成 熟 的 一 些 工 
具 。 即 使 是 在 以 前 发 展 得 较为 成 熟 的 命令 型 范 型 现在 已 经 不 太 流行 的 情况 下 ， 这 些 工 具 还 是 能 
继续 找到 其 应 用 价值 。 现 在 ， 我 们 转 而 研究 更 为 先进 的 工具 集 ， 称 之 为 统一 建 模 语言 《Unified 
Modeling Language ，UML)。 统 一 建 模 语 言 是 基于 面向 对 象 范 型 思想 发 展 而 来 的 。 然 面 ， 在 这 
个 工具 集中 ， 我 们 讨论 的 第 一 个 工具 是 用 例 图 〈use case diagram)。 无 论 其 潜在 的 范 型 如 何 ， 这 
个 工具 都 是 非常 有 用 的 ， 因 为 它 仅仅 尝试 着 从 用 户 的 视角 来 捕捉 预期 系统 的 画面 。 图 7-9 表示 
的 就 是 用 例 图 的 一 个 例子 。 
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图 7-9 ”一 个 简单 的 用 例 图 


用 例 图 是 用 大 的 矩形 框 来 描述 预期 的 系统 , 在 这 个 窟 形 框 中 ， 系统 与 其 用 户 之 间 的 交互 〈《 称 
为 用 例 〈use case)) 是 用 椭圆 来 表示 的 ， 而 系统 中 的 用 户 〈 称 为 参与 者 〈actor)) 用 火柴 人 表示 
(即使 角色 可 能 不 是 一 个 人 ， 也 这 人 么 表示 )。 这 样 ， 图 7-9 所 表示 的 束 古 Hospital Records 
svstem。 该 系统 在 获得 Physician 或 urse 的 请 求 时 ， 就 会 完成 Retrieve Medical Records 
这 个 用 例 。 

鉴于 用 例 图 是 从 预期 系统 的 外 部 来 观察 系统 的 ， 所 以 UML 提 供 了 许多 种 工具 ， 用 于 系统 内 
部 的 面向 对 象 设 计 。 其 中 的 一 种 工具 是 类 图 〈class diagram)， 它 是 一 个 标记 系统 ， 用 来 表示 类 
的 结构 和 类 之 间 的 联系 〈 在 UML 的 术语 中 称 为 关联 (association ) )。 举 一 个 例子 ， 考 虑 医生 、 
病人 和 病房 之 间 的 关系 ， 我 们 假定 表示 这 些 实体 的 对 象 是 分 别 从 类 Physician、Patient 和 
Room 构造 出 来 的 。 

图 7-10 表 明了 Physician 类 .Patient 类 以 及 Room 类 之 间 的 联系 在 UML 类 图 中 是 如 何 表 示 
的 。 用 矩形 框 表 示 类 ， 用 线 来 表示 关联 ， 关 联 线 上 可 能 有 标号 ， 也 可 能 没有 。 如 果 有 ， 那 粗 体 
箭头 被 用 来 指明 标号 被 读 的 方向 。 例 如 ， 在 图 7-10 中 带 标 捉 cares for 的 箭头 指示 医生 医治 病人 ， 
而 不 是 病人 医治 医生 。 有 时 联 线 上 带 有 两 个 术语 标号 ， 可 以 从 任 一 方向 读 取 头 联 。 图 7-10 中 的 
类 Patient 和 Room 之 间 的 关联 就 印证 了 这 一 点 。 

分 配 到 
Physician 本 Fatiemt 本 及 cern 
妥 夯 住宿 


图 7-10 ”一 个 简单 的 类 图 


除了 指明 类 之 间 的 关联 之 外 ， 类 图 还 能 表达 这 些 关联 的 多 样 性 。 也 就 是 说 ， 它 能 指明 一 个 
类 的 多 个 实例 如 何 与 其 他 类 的 实例 相关 联 。 这 个 信息 被 记录 在 关联 线 的 两 端 。 图 7-10 指 明 每 位 


外 
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病人 可 以 占据 一 个 房间 ， 而 每 个 房间 能 供给 0 位 或 1 位 病人 。( 我 们 假定 每 个 房间 都 是 私人 房间 。) 
* 表 示 一 个 任意 的 非 负数 。 这 样 ， 图 7-10 中 的 * 表 示 每 位 医生 可 以 医治 多 位 病人 。 而 在 关联 的 医 
生 端 的 1 表示 每 位 病人 只 被 一 位 医生 医治 。( 我 们 的 设计 只 考虑 主治 医生 的 作用 。) 

为 了 完整 性 起 见 ， 我 们 应 该 注意 到 关联 的 多 样 性 有 3 种 基本 形式 , 一 对 一 联系 、 一 对 多 联系 
和 多 对 多 联系 ， 如 图 7-11 所 示 。 一 对 一 联系 (one-to-one relationship) 的 一 个 例子 就 是 病人 和 病 
房 之 间 的 关系 ， 其 中 每 位 病人 只 能 分 配 一 个 房间 ， 而 且 每 个 病房 只 分 配给 一 位 病人 。 一 对 多 联 
系 〈one-to-many relationship) 的 一 个 例子 就 是 医生 和 病人 之 间 的 关系 ， 其 中 每 位 医生 可 以 照顾 
多 位 病人 ， 而 每 位 病人 只 有 一 位 〈 主 治 的 ) 医生 照顾 。 在 这 个 例子 中 ， 当 我 们 考虑 用 病人 与 盗 
询 医 生 之 间 的 联系 来 代替 病人 与 主治 医生 之 间 的 联系 时 ， 就 形成 了 多 对 多 联系 〈many-to-many 
Telationship )， 即 每 位 病人 可 以 有 几 个 咨询 医生 来 辅助 治疗 ， 而 每 位 咨询 医生 可 以 帮助 多 个 病人 。 
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图 7-11 X 类 型 实体 与 Y 类 型 实体 间 的 一 对 一 、 一 对 多 以 及 多 对 多 联系 


在 面向 对 象 的 设计 中 , 经 常会 出 现 一 个 类 表示 另 一 个 类 的 更 加 具体 的 版 本 。 在 这 种 情况 下 ， 
我 们 说 后 者 是 前 者 的 泛 化 。UML 提供 了 特殊 的 符号 来 表示 泛 化 。 图 7-12 给 出 了 一 个 例子 ， 它 描 
述 了 类 PatientRecord、PFatientFinancialRecora 和 PatientMedicalRecord 间 的 泛 化 。 
类 间 的 关联 用 带 空 箭头 的 箭头 表示 ， 这 是 UML 表 示 泛 化 的 关联 符号 。 注 意 ， 每 一 个 类 都 是 由 一 
个 矩形 表示 ， 格 式 里 面包 含 了 类 的 名 称 、 属 性 和 方法 〔 参 见 图 7-4)。 这 是 UML 在 类 图 中 表示 类 
的 内 在 特征 的 方法 。 图 7-12 中 描述 的 信息 是 : PatientRecord 类 是 PatientFinancialLRecorda 
类 的 活化 ， 同 时 也 是 PatientMedaicalRecorda 类 的 泛 化 。 也 就 是 说 ，PatientFinancial- 
Record 类 和 PatientMedicalRecord 类 包含 了 PatientRecord 类 的 所 有 特征 ， 并 附加 了 那些 
明确 地 列 在 它们 和 抑 形 框 中 的 特征 。 因 此 ，PatientFinancialRecord 类 和 PatientMeadical- 
Recorda 类 都 包含 病人 的 姓名 和 病历 号 ， 但 PatientFinancialRecord 类 还 包含 病人 账户 余额 
和 报告 病人 支付 历史 记录 的 能 力 , 而 PatientMedicalRecord 类 包含 了 病人 的 过 敏 证 和 报告 病 
人 病史 记录 的 能 力 。 

回顾 第 6 章 〈6.5$ 节 )， 在 面向 对 象 编程 环境 中 实现 泛 化 的 一 个 很 目 然 的 方式 就 是 利用 继承 。 
然而 ， 许 多 软件 工程 师 都 告 诚 说， 继承 并 不 是 对 所 有 的 泛 化 情况 都 适合 ， 原因 在 于 ， 继 承 寻 致 
了 类 间 的 强 耦 合 度 ， 这 种 耦合 在 软件 生命 周期 的 后 期 并 不 希望 出 现 。 例 如 ， 由 于 类 的 改变 会 目 
动 地 在 它 的 所 有 继承 类 中 得 到 反映 ， 因 此 ， 在 软件 维护 阶段 看 起 来 很 小 的 改动 承 能 够 导致 不 可 
预见 的 后 果 。 作 为 一 个 例子 ， 我 们 可 以 假设 一 个 公司 为 其 员工 开放 一 个 娱乐 设施 ， 这 也 就 意味 
着 娱乐 设施 里 的 所 有 具有 成 员 资格 的 人 员 是 该 公司 的 员工 。 为 了 给 这 个 设施 做 一 个 成 员 表 ， 程 序 
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留 7-12 描述 泛 化 的 一 个 类 图 


员 可 以 利用 继承 从 早先 已 经 定义 的 Employee 类 中 构建 一 个 RecreationMember 类 。 但 是 ， 如 
采 随 看 公司 后 来 的 效益 提高 ， 公 司 决定 对 员工 的 家 属 和 退休 员工 也 开放 娱乐 设施 ， 于 是 ， 
Employee 关 和 RecreationMember 类 之 间 内 含 的 耦合 性 问题 将 会 变 得 更 为 严重 。 所 以 ， 使 用 
继承 的 时 候 不 应 当 只 考虑 其 方便 性 ， 而 应 当 将 继承 的 使 用 严格 限制 在 需要 实现 的 活化 一 直 不 会 
更 改 的 情况 下 。 

头 图 代表 的 是 程序 设计 中 的 静态 特征 ， 它 不 能 表示 程序 在 执行 过 程 中 发 生 的 事件 序列 。 为 
了 次 未 这 种 动态 特征 , UML 提 供 了 一 系列 图 的 类 型 , 它们 被 统称 为 交互 图 (interaction diagram )。 
交互 图 的 一 种 是 序列 图 (sequence diagram)， 它 描述 了 完成 任务 所 涉及 的 个 体 〈 如 参与 者 、 完 
整 的 软件 构件 或 个 体 对 银 等 ) 间 的 通信 。 这 些 图 与 图 7-5 类 似 ， 因 为 它们 都 用 带 有 向 下 延伸 的 虚 
线 的 筷 形 表示 个 体 。 每 个 矩形 连同 它 的 虚线 被 称 为 生命 线 (life line)。 个 体 间 的 通信 用 连接 含 适 
生 合 线 的 带 标记 的 箭头 表示 ， 这 里 的 标记 指示 被 请 求 的 动作 。 当 自 顶 向 下 阅读 图 时 ， 这 些 箭头 
是 按时 间 先 后 次 序 出 现 的 。 当 个 体 完 成 请 求 的 任务 ， 并 把 控制 返回 给 请 求 的 个 体 〈 就 像 传 统 的 
从 一 个 过 程 返 回 ) 时 ， 这 时 用 一 个 指 回 原始 生命 线 的 无 标记 箭头 表示 通信 。 

固 此， 图 7-5 从 本 质 上 讲 是 一 个 序列 图 。 但 是 ， 图 7-5 的 语法 本 身 有 几 不 缺点 。 一 个 就 是 它 
个 允许 获取 两 对 手 间 的 对 称 ， 我 们 必须 画 出 单独 的 图 来 表示 开始 于 BlayerB 发 球 的 网 球 ， 即 使 
区 互 的 序列 与 Playera 发 球 的 非常 相似 。 而 且 ， 图 7-5 只 描述 了 一 个 指定 的 网 球 ， 一 个 一 般 的 网 
球衣 定 可 以 延伸 。 形 式 化 序列 图 有 在 单个 图 中 获取 这 些 变化 的 技术 ， 虽 然 我 们 不 需要 仔细 研究 
这 些 ， 但 我 们 还 是 应 该 简要 地 看 一 下 图 7-13 中 显示 的 形式 化 序列 图 ， 它 撒 述 了 基于 我 们 的 网 球 
比赛 设计 的 一 个 一 般 的 网 球 。 

还 要 注意 图 7-13 说 明了 整个 序列 图 是 包含 在 一 个 矩形 〈 称 之 为 帧 〈frame)) 中 的 。 帧 的 去 
上 角 是 一 个 包含 了 跟 有 标识 符 的 字符 sd〔〈 意 思 是 “sequence diagram”) 的 五 划 形 ， 这 个 标识 符 可 
能 是 标记 整体 序列 的 名 字 ， 或 〈 正 如 图 7-13 中 的 ) 是 被 调用 来 初始 化 序列 的 方法 的 名 字 。 注 意 ， 
与 图 7-5 对 比 ， 图 7-13 中 表示 参赛 手 的 矩形 并 没有 指定 具体 的 参赛 手 ， 而 仅仅 指示 为 它们 代表 
P1LaYyerClass“ 关 型 ”的 对 象 。 其 中 一 个 被 指定 为 self， 瑟 思 是 这 是 一 个 其 serve 方 法 被 激活 去 
杨 始 化 序列 的 对 象 。 
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self: PlayerClass ;Playerciass 
| ， 
evaluateServe 






指定 交互 ;指定 控 制 
段 类 型 广 一 一 一 一 一 ' ” 朗 互 段 的 条 件 
| | 上 | 


图 7-13 ”描述 一 般 网 球 的 序列 图 


关于 图 7-13 的 其 他 关键 点 是 它 处 理 两 个 内 部 的 矩形 ， 这 是 交互 段 (interaction fragment)， 它 
被 用 来 表示 一 个 图 中 的 候选 序列 。 图 7-13 包 含 了 两 个 交互 段 ， 一 个 标记 为 “loop ”， 另 一 个 标记 
为 “alt” 这 本 质 上 是 我 们 首先 在 第 5.2 节 伪 代 码 中 遇 到 的 while 和 ithen_else 结 构 。 “Joop” 交 互 
段 表 明 边 界 内 的 事件 将 重复 ， 只 要 Judge 对 象 判定 validPlay 的 值 为 真 , “alt” 交互 段 表 明 根 据 
fromServezr 的 值 是 真是 假 ， 其 中 一 个 候选 序列 被 执行 。 

最 后 ， 在 这 里 介绍 类 -职责 -协作 卡 tclass-responsibility-collaboration card， 简 称 CRC 卡 ) 的 
功能 还 是 比较 合适 的 ， 尽 管 这 部 分 内 容 不 属于 UML 但 它 在 确立 面向 对 象 设计 的 有 效 性 方面 起 
着 很 重要 的 作用 。CRC 卡 是 一 张 简单 的 卡片 ， 上 面 写 着 有 关 对 象 的 描述 。 利 用 这 种 方法 ， 软 件 工 
程 师 为 预期 系统 的 每 个 对 象 做 一 张 卡片 ， 然后 在 模拟 系统 中 用 这 些 卡片 来 表示 对 象 ， 可 以 在 桌面 
上 进行 ， 也 可 以 通过 一 个 “舞台 表演 ”的 实验 ， 和 正 实验 中 ， 设 计 团 队 的 每 个 成 员 手持 一 张 卡片 ， 
然后 表演 卡片 上 所 描述 的 对 象 角 色 。 这 样 的 模拟 〈 通 间 称 为 结构 化 走 查 〈stmctured walkthrough ) ) 
在 设计 阶段 的 排 错 能 力 要 优 于 设计 的 实现 阶段 ， 因而 被 证 明 是 一 种 比较 有 效 的 方法 。 


7.5.3 设计 模式 


对 软件 工程 师 而 言 ， 越 来 越 有 用 的 工具 是 设计 模式 集 的 发 展 。 设 计 模 式 《design Pattern ) 
征用 来 解决 软件 设计 过 程 中 反复 出 现 的 问题 的 一 种 预见 开发 的 方法 。 例 如 ， 适 配器 (Adapter) 
使 六 提 供 了 一 个 解决 办 法 ， 用 来 解决 通过 预制 模块 来 构建 软件 的 过 程 中 经 常 出 现 的 问题 具体 
来 说 ， 预 制 模块 可 能 已 经 具备 了 即将 解决 的 问题 所 需 的 功能 性 ， 但 可 能 还 没有 与 当前 应 用 相 一 
敏 的 接口 。 在 这 样 一 种 情况 下 ， 适 配器 模式 可 以 被 用 作 一 种 标准 方法 ， 将 模块 封装 在 另外 一 个 


你 甘 里 ， 但 什么 也 不 做 ， 仅 仅 需要 为 原始 模块 的 接口 与 外 部 世界 之 间 提供 解释 功能 ， 这 样 -来 


区 允许 原始 的 预制 模块 用 于 该 应 用 中 。 
忆 一 种 成 熟 的 设计 模式 是 装饰 者 (Decorator) 模式 ， 它 提 供 了 一 种 用 来 设计 系统 的 方法 ， 
而 所 议 计 的 系统 依据 当时 的 环境 完成 一 些 来 自 于 相同 的 活动 的 不 同 细 合 。 这 种 系统 会 产生 大 量 
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的 选择 ， 如 果 没 有 经 过 仔细 的 设计 ， 很 可 能 导致 软件 的 极 大 的 复杂 度 。 但 是 ， 装 饰 者 模式 提供 


了 一 个 实现 这 类 系统 的 标准 化 方式 ， 从 而 产生 了 一 种 易于 管理 的 解决 办 法 。 

设计 模式 中 的 重复 问题 的 识别 以 及 设计 模式 的 创建 和 分 类 在 软件 工程 领域 里 是 一 个 正在 进 
行 的 过 程 。 然 而 ， 其 目标 不 仅仅 是 找到 设计 问题 的 解决 办 法 ， 还 要 找到 高 质量 的 解决 方案 ， 这 
种 解决 方案 在 软件 生命 周期 的 后 期 能 提供 很 好 的 灵活 性 。 所 以 ， 对 诸如 耦合 最 小 化 和 内 聚 最 大 
化 这 样 好 的 设计 原则 的 考虑 ， 在 设计 模式 的 发 展 过 程 中 起 着 重要 的 作用 。 

设计 模式 在 发 展 过 程 中 所 取得 的 进展 成 索 ， 在 今天 的 软件 开发 包 所 提供 的 工具 库 中 得 到 了 
体现 , 如 SUN 公司 提供 的 Java 编程 环境 以 及 微软 公司 提供 的 ,NET 框架 等 。 事实 上 , 在 这 些 “ 工 
具 包 ” 中 找到 的 大 多 数 “ 模 板 ”本 质 上 是 设计 模式 的 框架 ， 这 就 为 设计 问题 找到 了 现成 的 、 商 
质量 的 解决 方案 。 

最 后 ， 我 们 要 提 到 的 是 ， 软 件 工程 里 的 设计 模式 的 出 现 是 不 同 的 领域 相互 促进 的 一 个 很 好 
的 例子 。 设 计 模 式 的 起 源 来 自 于 Christopher Alexander 在 传统 建筑 领域 里 的 研究 , 他 的 目标 是 发 
现 那 些 提高 建筑 设计 质量 的 特征 ， 然 后 开发 包含 这 些 特征 的 设计 模式 。 今 天 ， 软 件 设计 中 已经 
包含 了 他 的 许多 思想 ， 并 且 许 多 软件 工程 师 能 继续 从 他 所 做 的 工作 中 汲取 灵感 。 


问题 与 练习 
. 请 画 一 个 数据 流 图 ， 用 来 表示 当 一 名 读者 从 图 书馆 外 检索 图 书 时 的 数据 流向 。 
. 请 画 出 图 书馆 记录 系统 的 用 例 图 。 


. 请 画 出 一 个 类 图 ， 用 来 表示 旅客 与 他 们 住 的 酒店 之 间 的 联系 。 

, 画 出 表示 人 是 雇员 的 汉化 的 类 图 ， 包 括 可 能 属于 每 个 类 的 一 些 属性 。 
. 把 图 7-5 转 化 为 完整 的 序列 图 。 

. 在 软件 工程 的 过 程 中 ， 设 计 模 式 扮演 着 什么 样 的 角色 ? 


En 中 一 


nn 


7.6 ”质量 保证 


软件 故障 、 费 用 超标 、 逾 过 期 限 等 现象 的 迅速 产生 ， 对 软件 质量 控制 方法 的 改进 提出 了 要 
求 。 本 节 我 们 考虑 一 些 在 此 努力 中 所 妃 求 的 方向 。 


7.6.1 质量 保证 的 范围 


在 计算 机 技术 发 展 的 早期 ， 生 产 合格 软件 的 关注 点 主要 集中 在 去 除 在 实现 过 程 中 产生 的 编 
程 错误 。 在 本 节 的 后 面 ， 我 们 将 讨论 在 这 方面 上 取得 的 进步 。 然 而 ， 如 今 软 件 质量 控制 的 范围 
远 超出 了 调试 过 程 ， 它 的 分 支 包括 改进 软件 工程 过 程 的 改善 ， 开 设 课程 以 确保 员工 具有 上 峡 资 
格 ， 以 及 确立 健全 的 软件 工程 标准 等 。 在 这 个 方面 ， 我 们 已 经 注意 到 像 13O、IEEE 和 ACM 这 些 
组 织 在 提升 职业 化 程度 和 设立 标准 方面 所 起 的 作用 ， 以 评估 软件 开发 公司 内 部 的 质量 控制 。 一 
个 典型 的 例子 是 ISO9000 系 列 标准 ， 它 提供 给 许多 像 设 计 、 生 产 、 安 装 、 服 务 这 梓 的 工业 活动 ; 
另外 一 个 例子 是 ISOAIEC 15$04， 它 是 由 ISO 和 国际 电工 委员 会 (IEC) 联合 制定 的 一 套 标准 。 

现在 大 多 数 软 件 承 包 商 要 求 他 们 雇用 来 开发 软件 的 组 织 符 合 这 样 的 标准 。 这 样 ， 软 件 开发 
公司 正在 建立 软件 质量 保证 (SQA) 小 组 ， 它 负责 监督 和 强制 执行 组 织 采 用 的 质量 控制 系统 。 
这 样 ， 在 传统 的 瀑布 模型 下 ，SQA 小 组 将 负责 在 设计 阶段 之 前 的 批准 软件 需求 规格 说 明 的 ， 或 
在 实现 开始 前 批准 设计 及 相关 的 文档 。 

许多 主题 都 强调 为 当今 质量 控制 所 做 的 努力 ， 其 中 之 一 就 是 记录 保存 。 为 了 将 来 能 够 做 参 
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涯 ， 在 开发 过 程 中 的 每 一 步 都 要 被 准确 地 记 入 文档 ， 这 是 非常 重要 的 。 但 是 ， 这 个 目标 与 人 类 
的 本 性 相 冲 突 。 问 题 是 在 没有 修改 相关 文档 的 情况 下 就 作出 决定 或 改变 决定 ， 这 是 一 种 诱惑 。 
因此 ， 记 录 有 可 能 是 不 正确 的 ， 从 而 在 未 来 阶段 使 用 它 时 很 有 可 能 会 产生 严重 后 果 。 CASE 工 具 
共有 非常 大 的 好 处 ， 它 使 得 像 重 画 示意 图 和 更 新 数据 字典 这 类 任务 与 手工 方法 相 比 ， 要 更 加 容 
易 。 因此， 更 可 能 会 对 记录 进行 更 新 ， 最 终 的 文档 也 更 可 能 是 准确 的 ， 《这 只 是 软件 工程 必须 与 
人 性 弱 氮 相 结合 的 多 个 实例 之 一 。 其 他 的 例子 包括 当 人 们 共事 时 ， 个 可 避免 的 人 性 冲突 、 嫉 妒 、 
产生 的 自我 抵触 等 。) 

昼 一 个 与 质量 相关 的 主题 是 评审 〈review) 的 使 用 ， 其 中 涉及 软件 开发 项 目的 各 方 聚 在 一 
起 ， 考 虑 一 个 指定 的 话题 。 评 审 贯穿 整个 软件 开发 过 程 ， 采 用 的 形式 是 青 求 评审 、 设 计 评 审 
和 实现 评审 。 在 需求 设计 的 早期 ， 可 能 表现 为 原型 演示 ， 或 为 软件 设计 团队 成 员 间 的 结构 化 走 
吾 ， 或 为 实现 设计 相关 部 分 的 程序 员 间 的 协调 。 这 样 的 评审 〈 基 于 重复 的 基础 ) 提供 了 沟通 的 
盯 道 ， 通 过 它 误解 得 以 避免 ， 错 误 在 造成 灾难 前 得 以 更 正 。 评审 的 重要 性 已 经 被 这 样 的 事实 佐 
证 : 在 下 EE 标 准 中 ， 对 于 软件 评审 有 专门 的 论述 ， 这 就 是 众所周知 的 IEEE1028。 

有 些 评审 在 本 质 上 是 关键 的 。 一 个 例子 就 是 项 目 利益 相关 者 的 代表 和 软件 开发 团队 之 间 进 
行 讨 审 ， 以 批准 最 终 软件 需求 规格 说 明文 档 。 实 际 上 ， 获 批 就 标志 本 需求 分 析 阶 段 的 正式 结束 ， 
同时 它 也 是 后 续 开发 过 程 进 行 的 基础 。 但 是 ， 从 质量 控制 的 角度 来 说 ,所 有 的 评审 都 是 重要 的 ， 
它们 都 应 该 被 记 入 文档 ， 作 为 正在 进行 的 记录 维护 过 程 的 一 部 分 。 


7.6.2 ”软件 测试 


软件 质量 保证 现在 被 认为 是 贯穿 整个 开发 过 程 的 一 个 热点 ， 程序 的 测试 和 验证 本 身 一 直 是 
研究 的 主题 。 在 5.6 节 中 ， 我 们 讨论 了 用 数学 上 严格 的 方法 验证 算法 正确 性 的 技术 ， 但 结论 是 如 
今 大 多 数 软件 要 使 用 测试 来 “验证 ” 但 是 ， 这 种 测试 最 多 只 是 一 种 不 精确 的 方法 。 除 非 我 们 对 
一 个 软件 做 足够 多 的 测试 ， 穷 尽 所 有 可 能 的 情况 ， 否则 我 们 还 是 不 能 说 这 个 软件 没有 错误 。 即 
使 是 简单 的 程序 ， 也 可 能 有 无 数 条 可 以 遍历 的 路 径 。 所 以 ， 对 一 个 复杂 的 程序 的 所 有 可 能 的 路 
径 进 行 测试 是 不 可 能 的 。 

为 一 方面 ， 软 件 工程 师 已 经 开发 出 了 一 些 测试 方法 ， 在 经 过 有 限 次 测试 的 情况 下 ， 提 高 发 
坝 软 件 错误 的 可 能 性 。 其 中 一 种 是 基于 这 样 的 观察 ， 印 软件 中 的 错误 趋 于 类 聚 。 也 就 是 说 ， 经 
验 表 明 ， 一 个 大 型 的 软件 系统 中 会 有 一 小 部 分 模块 比 其 他 模块 更 容易 出 问题 。 所 以 ， 与 其 把 所 
有 的 模块 都 进行 相同 的 、 不 彻底 的 测试 ， 还 不 如 去 确定 那些 容易 出 错 的 模块 ， 对 它们 进行 彻底 
的 铀 试 ， 这 样 可 以 发 现 系 统 的 更 多 错误 。 这 就 是 所 谓 的 帕 累 托 法 则 (Pareto principle) 的 一 个 实 
例 。 该 法 则 援引 自 意大利 经 济 学 家 、 社 会 学 家 维 夫 雷 多 . 帕 累 托 (Vilfredo Pareto，1848 一 1923 )， 
他 发 现 意大利 的 一 小 部 分 人 口 控制 了 意大利 的 大 部 分 财富 。 在 软件 工程 领域 , 帕 累 托 法 则 认为 ， 
通过 对 一 个 集中 区 域 施加 作用 ， 往 往 就 可 以 明显 地 改变 结果 。， 

”软件 测试 的 另 一 种 方法 称 为 基本 路 径 测试 (basis path testing)， 这 种 方法 要 开发 出 一 组 测试 
数据 ， 并 且 这 组 数据 要 能 保证 软件 中 的 每 条 指令 都 能 至 少 执行 一 次 。 用 称 为 图 论 的 数学 领域 已 
经 开发 出 确定 这 种 测试 数据 集 的 技术 。 所 以 ， 虽然 不 可 能 保证 通过 软件 系统 的 每 条 路 径 都 得 到 
测试 ， 但 是 可 以 做 到 在 测试 过 程 中 ， 系 统 的 每 条 语句 至 少 能 执行 一 次 。 

基于 帕 累 托 法 则 和 基本 路 径 测试 的 技术 都 依赖 于 对 被 测试 软件 的 内 部 构成 的 理解 ， 因此 ， 
这 类 测试 都 属于 所 谓 的 白 盒 测试 〈glass-box testing) 这 一 类 ， 这 也 就 意味 着 软件 测试 人 员 要 了 
解 软件 的 内 部 结构 ， 在 设计 测试 的 时 候 要 利用 到 这 些 知 识 。 相反 ， 还 有 一 类 测试 称 之 为 黑 盒 测 
试 〈black-box testing )， 这 类 测试 并 不 依赖 于 对 软件 内 部 构成 的 了 解 。 简 而 言 之 ， 黑 盒 测试 是 从 
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用 户 的 角度 来 完成 的 。 在 黑 盒 测试 过 程 中 ， 测 试 人 员 并 不 关心 软件 本 身 是 如 何 工 作 的 ， 而 只 注 
重 软件 在 精确 度 和 时 间 性 方面 是 否 能 正确 执行 。 

黑 盒 训 试 的 一 种 方法 是 称 为 边界 值 分析 (boundary value analysis) 的 技术 ， 它 由 标明 数据 
范围 的 等 价 类 构成 ， 其 中 要 确定 软件 规格 说 明 的 边界 点 ， 并 在 这 些 边界 点 上 测试 软件 。 例 如 ， 
如 果 软 件 需要 接受 指定 范围 内 的 输入 值 ， 那 么 就 可 以 在 这 个 范围 内 的 最 低 值 和 最 高 值 处 对 该 软 
件 进行 测试 ， 或 者 如 果 软 件 需要 协调 多 个 活动 ， 那 么 就 可 以 对 一 组 要 求 最 高 的 活动 进行 测试 。 
基于 的 理论 是 : 通过 标识 等 价 类 ， 由 于 对 于 一 个 等 价 类 内 的 几 个 例子 的 正确 操作 往往 要 验证 整 
小 类 的 软件 ， 所 以 测试 用 例 的 数量 可 以 最 小 化 。 而 且 标 识 出 一 个 类 内 错误 的 最 佳 机 会 是 使 用 类 
边界 上 的 数据 。 

黑 盒 测试 的 另外 一 种 方法 是 B 测试 (beta testing), 在 得 到 产品 最 终 版 本 并 向 市 场 发 布 之 前 ， 
软件 的 官 步 版 本 被 发 给 有 意 学 习 软 件 在 现实 环境 中 如 何 执行 的 部 分 用 户 。( 在 开发 者 地 点 进行 的 
类 似 测试 称 之 为 c 测 试 (和 tpha testing)。) B 测 试 的 优点 远 远 超越 了 传统 的 排查 错误 。 通 过 这 种 测试 
所 获得 的 普通 用 户 的 反馈 意见 《无 论 正面 或 负面 ) 将 有 助 于 调整 市 场 策 略 。 而 且 ， 早 些 时 候 发 
布 的 beta 线 的 软件 有 助 于 其 他 软件 开发 者 设计 出 与 之 兼容 的 产品 。 例 如 ， 就 PC 市 场 的 新 操作 系 
统 来 说 ， 其 beta 版 本 的 发 布 会 鼓励 与 之 兼容 的 工具 软件 的 开发 ， 所 以 最 终 版 的 操作 系统 上 市 时 ， 
”了 吏 已 经 有 与 之 相配 的 软件 产品 出 现 。 而 且 ，beta 版 软件 的 存在 会 在 市 场 上 造成 一 种 对 软件 产品 
-期待 的 感觉 。( 一 种 增加 推广 和 销量 的 氛围 。) 


问题 与 练习 


.软件 开发 组 织 内 的 SQA 小 组 的 作用 是 什么 ? 

,从 性 是 以 什么 方式 与 质量 保证 对 立 的 ? 

:说 出 两 种 开发 过 程 中 用 来 加 强 质量 的 主题 。 

- 在 铀 试 软 件 时 ， 一 个 成 功 的 测试 是 发 现 了 错误 ， 还 是 没有 发 现 错误 ? 

. 为 了 确定 系统 中 的 哪些 模块 应 该 接受 比 其 他 模块 更 为 彻底 的 测试 ， 你 会 建议 采用 什么 技术 ? 

- 一 个 软件 包 设 计 用 来 对 不 超过 100 项 的 表 进 行 排序 ， 请 问 ， 对 此 软件 包 采 用 什么 样 的 测试 最 为 合适 ? 


7.7 “文档 编制 





交 直 辣 林 芋 本 -下 攻 本 避让 林寺 硼 直 站 和 直 二 村 区 后 2 而 开 


如 果 人 们 不 能 学 会 使 用 和 维护 软件 系统 ， 那 么 这 个 软件 系统 也 就 没 多 大 的 用 处 。 因 此 ， 文 


档 是 软件 包 的 一 个 重要 的 部 分 ， 而 文档 的 编写 也 就 成 了 软件 工程 领域 里 的 一 个 重要 课题 。 
软件 文档 有 3 个 用 途 ， 因 而 也 就 可 以 将 文档 划分 为 3 类 : 用 户 文 档 、 系 统 文档 以 及 技术 文 
档 。 用 户 文档 〈user documentation) 用 来 解释 软件 的 特性 ， 并 描述 如 何 使 用 软件 。 所 设计 的 用 
户 文档 是 给 用 户 《〈 所 以 称 为 用 户 文档 ) 浏览 的 ， 因 而 ， 甚 编写 方式 上 采用 的 是 应 用 方面 的 术语 。 
今天 , 用 户 文档 被 公认 为 是 一 种 重要 的 市 场 工具 。 好 的 用 户 文档 加 上 精心 设计 的 用 户 界 面 ， 
使 得 软件 更 容易 为 人 们 所 接受 ， 这 样 就 提高 了 销售 量 。 正 因为 认识 到 这 一 点 ， 许 多 软件 开发 商 
聘请 熟悉 技术 的 编写 人 员 为 其 生产 产品 的 这 一 部 分 ， 或 者 他 们 将 自己 软件 产品 的 初级 版 本 提供 
给 独立 作者 。 这 样 一 来 ， 当 软件 开始 向 公众 发 布 正式 版 时 ， 书 店 里 也 同时 有 了 关于 如 何 使 用 该 
软件 的 书籍 。 
用 户 文 档 传 统 上 是 纸 质 书籍 或 小 册子 形式 ， 但 是 许多 情况 下 同样 的 信息 也 包含 在 该 软件 中 
成 为 其 组 成 部 分 。 这 使 读者 在 使 用 软件 时 能 参考 文档 。 此 时 ， 信 息 可 能 分 割 成 小 单元 ， 有 时 称 
为 帮助 包 。 如 果 用 户 在 多 个 命令 之 间 犹 耶 不 决 时 ， 帮 助 包 中 的 信息 可 以 自动 出 现在 屏幕 上 。 
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系统 文档 〈system documentation) 用 来 描述 系统 的 内 部 构成 ， 便于 在 系统 日 后 的 生命 周期 
中 进行 维护 。 系 统 文档 的 一 个 主要 部 分 是 系统 中 所 有 程序 的 源 代 码 。 这 些 源 程序 应 以 易 读 的 格 
尺 提 交 ， 这 一 点 很 重要 。 这 就 是 为 什么 软件 工程 师 支持 采用 精心 设计 的 高 级 编程 语言 ， 采 用 注 
释 语 句 对 程序 进行 注释 ， 采 用 协调 一 致 、 思 路 清晰 的 模块 设计 的 原因 。 实 际 上 ， 大 多 数 软件 开 
人 及 公司 部 有 一 定 的 要 求 其 员工 在 编写 程序 的 时 候 遵循 的 约定 。 例 如 ， 使 程序 编写 得 有 条 理 的 缩 
排 约 定 ， 确 立 变量 、 常 量 、 对 象 以 及 类 等 不 同 程序 结构 的 命名 约定 ， 以 及 保证 所 有 程序 都 能 有 
效 地 文档 化 的 文档 编写 约定 。 这 些 约定 在 整个 公司 的 软件 中 都 是 统一 的 ， 这 样 最 终 就 能 简化 软 
件 的 维护 过 程 。 

为 外 一 个 系统 文档 的 组 成 部 分 是 设计 文档 的 记录 ， 其 中 包括 了 软件 需求 规格 说 明文 档 和 显 
不 这 坚 规 格 说 明 在 设计 期 间 如 何 获得 的 记录 。 这 些 信息 对 于 软件 的 维护 是 有 帮助 的 ， 因 为 它 指 
习 了 软件 为 何 要 这 样 实现 ， 同 时 这 些 信息 也 降低 了 这 样 一 种 可 能 性 ， 即 在 维护 阶段 所 做 出 的 变 
更 会 破坏 系统 的 集成 。 

技术 文档 〈technical documentation) 是 用 来 描述 软件 系统 是 如 何 安装 的 以 及 相关 的 服务 〈 如 调 
整 操作 参数 、 安 装 更 新 以 及 将 出 现 的 问题 反馈 给 软件 开发 人 员 等 )。 软 件 的 技术 文档 与 汽车 工业 中 
的 提 代 给 汽车 修理 工 的 文档 类 似 。 这 份 文档 不 讨论 汽车 是 怎样 设计 和 构造 的 《这 类 似 于 软件 的 系 统 
文 权 )， 也 不 解释 如 何 驾驶 汽车 和 操作 汽车 加 热 /制冷 系统 (这 类 似 于 软件 的 用 户 文 档 》， 而 是 用 来 描 
述 如 何 维护 汽车 的 配件 ， 例 如 ， 如 何 蔡 换 变速 箱 ， 或 者 如 何 解决 断断续续 的 电气 方面 的 问题 . 

在 PC 机 领域 里 ， 软 件 的 技术 文档 和 用 户 文档 之 间 的 差异 就 变 得 比较 模糊 了 ， 这 是 因为 用 
广 通 常 自 己 安装 和 维护 软件 。 然 而 ， 在 多 用 户 的 环境 中 ， 这 种 差异 就 更 明显 了 ， 因 为 这 种 情况 
下 ， 技 术 文档 是 提供 给 系统 管理 员 使 用 的 ， 系 统管 理 员 在 其 权限 下 负责 所 有 软件 的 维护 ， 人 多 许 
用 户 将 软件 包 作为 抽象 工具 来 访问 。 


问题 与 练习 

1 软件 可 以 以 嘱 些 形式 文档 化 ? 

2. 系统 文档 是 在 软件 生命 周期 的 哪个 〈 哪 些 ) 阶段 进行 准备 ? 
3. 程序 和 它 的 文档 相 比 ， 哪 个 更 重要 ? 
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回顾 一 下 7.2 节 ， 其 中 讲 到 需求 分 析 阶 段 的 一 项 任务 即 是 定义 要 开发 的 软件 系统 将 如 何 与 它 
的 环境 进行 交互 。 本 节 我 们 将 考虑 与 这 个 交互 相关 的 主题 ， 那 就 是 当 它 涉及 与 人 交流 时 的 情况 ， 
这 是 一 个 意义 深远 的 主题 。 毕 竟 ， 应 该 允许 用 户 把 软件 系统 当 作 一 个 抽象 工具 来 使 用 。 这 个 工 
具 应 该 易于 使 用 ， 最 小 化 〈 理 想 上 消灭 了 ) 用 户 与 系统 间 的 交流 错误 。 这 意味 着 系统 界面 的 设 
于 应 方便 用 户 的 使 用 ， 而 不 仅 是 作为 软件 系统 的 权宜 之 计 。 

民 好 的 界面 设计 非常 重要 ， 因 为 与 系统 的 其 他 特性 相 比 ， 系统 界面 容易 给 用 户 留 下 更 深刻 
的 印象 。 毕 竟 ， 用 户 往往 会 从 系统 的 可 用 性 角度 来 审视 一 个 系统 ， 而 不 是 从 它 如 何 巧 妙 地 执行 
了 其 内 部 任务 这 个 角度 。 从 用 户 的 视角 来 说 ， 他 们 可 能 会 根据 系统 界面 在 具有 竞争 性 的 系统 之 
间 做 出 选择 。 因 此 ， 系统 界面 的 设计 可 能 成 为 判定 一 个 软件 工程 项 目 是 否 成 功 的 最 终 决定 因素 。 

由 于 这 些 原 因 ， 人 机 界面 在 软件 开发 项 目的 需求 分 析 阶段 已经 成 为 一 个 很 重要 的 关注 点 ， 
它 发 展 为 软件 工程 的 一 个 子 领域 。 事 实 上 ， 有 些 人 主张 人 机 界面 的 研究 是 一 个 完全 独立 的 领域 。 

对 和 机 界面 设计 的 研究 主要 来 自 于 称 为 人 体 工 程 学 〈ergonomic) 和 知行 学 〈cognetic) 的 
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| 知行 学 处 理 协 调 人 类 精神 能 力 的 设计 系 
统 。 这 两 个 学 科 中 ， 人 体 工程 学 更 好 理解 一 些 ， 主 要 是 因为 人 类 已 经 跟 机 器 打 了 几 个 世纪 的 交 
道 。 这 些 例 子 有 :古代 工具 、 和 这 些 历史 大 部 分 是 不 证 自明 的 ， 但 是 有 时 人 体 
工程 学 的 应 用 与 直觉 是 相反 的 。 一 个 经 常 被 提 到 的 例子 就 是 打字 机 键盘 〈 现 在 已 经 衍生 为 电脑 
键盘 ) 的 设计 ， 其 中 键 被 有 意 排列 ， 以 降低 打字 员 的 速度 ， 这 样 早期 机 器 上 使 用 的 分 层 机 械 系 
统 就 不 会 卡 住 。 

相反 ， 与 机 器 的 精神 交互 是 一 个 相对 新 的 现象 。 因 此 知行 学 在 富有 成 效 的 研究 和 洞察 力 启 
发 方面 拥有 更 商 的 潜力 。 通 常 这 些 研 究 成 果 更 具有 它们 的 精妙 之 处 。 比 如 ， 从 表面 上 看 人 类 的 
民 好 习惯 有 助 于 提高 效率 ， 但 有 些 习 惯 也 会 导致 一 些 错误 ， 即 使 界面 设计 本 意 上 是 要 解决 问题 
的 。 考 虑 一 下 用 户 要 求 操作 系统 删除 一 个 文件 的 过 程 ， 为 了 防止 误 删 ， 大 部 分 系统 都 会 要 求 用 
户 确认 一 个 请 求 ， 这 可 能 会 通过 一 个 “你 是 否 真 的 想 删除 这 个 文件 ”的 信息 加 以 确认 。 乍 一 看 ， 
这 个 确认 信息 好 像 解 决 了 误 删 的 问题 ， 但 是 使 用 了 这 个 系统 一 段 时间 后 ， 用 户 会 养 成 习惯 ， 自 
动 回 答 这 个 要 求 为 “是 ”的 信息 。 这 样 ， 这 个 删除 文件 的 任务 就 从 包含 删除 命令 和 对 问题 思考 
后 的 啊 应 的 两 步 过 程 ， 变 成 了 “删除 一 是 ”的 一 步 处 理 过 程 ， 这 就 意味 着 当 用 户 意 识 到 提交 了 
包 误 的 删除 要 求 时 ， 这 个 请 求 其 实 已 经 被 确认 ， 文 件 也 已 经 被 删除 。 

当 人 们 需要 使 用 几 个 应 用 软件 包 时 ， 习 惯 的 形成 也 可 能 会 带 来 问题 。 这 些 软件 包 的 界面 可 
能 相似 ， 但 还 是 有 些 不 同 的 。 相 似 的 用 户 操作 可 能 会 导致 不 同 的 系统 响应 ， 或 类 似 的 系统 响应 
可 能 需要 不 同 的 用 户 操作 。 所 以 在 这 种 情况 下 ， 在 某 种 应 用 软件 上 养 成 的 操作 习惯 可 能 会 在 其 
他 应 用 软件 上 导致 错误 的 发 生 。 

态 外 一 个 与 人 机 界面 设计 研究 有 关 的 人 类 特质 就 是 人 类 注意 力 的 狭隘 性 ， 也 就 是 当 集 中 度 
增加 时 ， 人 类 注意 力 往往 变 得 更 加 专注 。 随 着 人 类 越 来 越 专注 于 手头 上 的 工作 ， 打 破 这 种 专注 
也 越 来 越 困 难 。1972 年 ， 一 架 商 务 飞 机 因为 飞行 员 太 过 专注 于 降落 器 的 问题 〈 实 际 上 ， 是 在 处 
理 改 变 降 落 齿 轮 指 示 灯 的 过 程 中 )， 尽 管 当时 在 驾驶 舱 里 的 警报 已 经 很 响 了 ， 飞 机 还 是 笔直 地 撞 
站 地 面 ， 造 成 空难 的 发 生 。 

个 人 计算 机 的 界面 中 经 常会 出 现 一 些小 状况 。 比 如 , 大 小 写 灯 是 为 了 显示 键盘 处 在 大 写 
键 锁 定 模式 下 《〈 即 “大 写 锁 定 ” 键 被 按 了 )。 但 是 ， 如 果 有 人 不 小 心 按 了 大 小 写 按键 ， 直 到 
奇异 的 字符 出 现在 屏幕 上 , 用 户 才 会 注意 到 灯 的 变化 。 即 使 如 此 ,用户 依然 会 迷茫 一 会 才 会 
发 现 问题 的 原因 。 从 某 种 意义 上 来 说 ， 用 户 看 不 到 大 小 写 灯 的 变化 是 很 正常 的 ， 因 为 键盘 的 
指示 灯 不 在 用 户 的 视线 范围 之 内 。 但 是 , 通常 用 户 不 能 注意 到 直接 放 署 在 他 们 视线 中 的 指示 
灯 。 二 如 ， 生 大 会 羡 注 于 他 们 的 工作 而 无 法 发 现 显示 器 上 光标 的 形状 ， 即 使 观察 光标 是 他 们 
人 辣 殴 | 

还 有 吃 外 一 个 在 界面 设计 阶段 必须 预先 考虑 的 人 类 特质 就 是 并 行 处 理 多 个 事情 时 有 限 的 思 
考 能 力 。 在 1956 年 《心理 评论 》 的 一 篇 文章 中 ，GeorgeA.Miller 的 研究 表明 ， 人 类 大 脑 在 同一 时 
间 最 多 处 理 7 个 细节 问题 。 因 此 ， 界 面 被 设计 成 : 当 决 定 需要 时 ,界面 上 要 呈现 所 有 相关 的 信息 ， 
而 不 征 依 顿 于 人 关 用 户 的 记忆 ， 这 是 非常 重要 的 。 特 别 地 ， 要 求人 类 记 住 先前 屏幕 图 像 中 的 精 
确 细 节 ， 这 是 很 糟糕 的 设计 。 更 进一步 地 ， 如 果 界 面 需要 用 户 在 屏幕 图 像 间 广泛 地 导航 ， 用 户 
会 变 得 很 迷惑 。 因 此 ， 屏 幕 图 像 的 内 容 和 安排 成 为 一 个 重要 的 设计 问题 。 

尽管 人 体 工 程 学 和 知行 学 的 应 用 使 得 人 机 界面 设计 折射 出 独特 的 韵味 。 但 这 个 领域 还 是 围 
统 厦 很 多 软件 工程 中 更 加 传统 的 主题 。 特 别 地 ， 搜 索 度量 在 界面 设计 领域 和 更 传统 的 软件 工程 
领域 中 具有 同样 的 重要 性 。 界 面 可 以 度量 的 特性 包括 了 解 一 个 界面 所 需 的 时 间 、 在 界面 上 完成 
任务 所 需 的 时 间 、 用 户 界面 出 错 的 概率 、 一 段 时 间 不 用 后 用 户 使 用 界面 的 熟练 程度 ， 甚 至 是 一 
些 诸如 用 户 对 界面 喜好 程度 的 主观 特性 。 
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GOMS 模 型 最 初 在 1954 年 提出 ， 它 是 人 机 界面 设计 领域 里 度量 搜索 的 范例 。 这 个 模型 的 基 
础 方法 论 是 从 用 户 的 目标 角度 《如 删除 文档 中 的 某 个 字 )、 操 作 《〈 如 点 击 鼠 标 按键 )、 方 法 〈 如 
双击 限 标 ， 然 后 按 删 除 键 ) 和 选择 规律 《实现 相同 目标 的 两 种 方法 间 的 选择 ) 分 析 任务 。 实 际 
上 这 个 就 是 GOMS 缩 写 的 起 源 一 一 goals 〈 目 标 )、operators( 操 作 )、methods( 方 法 ) 以 及 selection 
rules (选择 规律 )。 简 言 之 , GOMS 就 是 一 种 把 用 户 使 用 一个 界面 的 动作 分 析 成 基本 步骤 序列 ( 按 
键 、 移 动 鼠 标 和 作出 决定 ) 的 方法 论 。 每 个 基本 步骤 的 性 能 都 被 赋予 一 个 精确 的 时 间 段 ， 这 样 
通过 把 任务 中 每 个 步骤 赋予 的 时 间 相 加 ， 从 完成 相似 任务 每 个 界面 所 需 的 时 间 这 个 角度 来 看 ， 
GMOS 提 供 了 一 种 比较 不 同 的 提议 界面 的 方法 。 

理解 医 似 于 GMOS 的 技术 细节 不 是 我 们 当前 研究 的 目的 , 我 们 事例 的 要 点 是 在 人 类 行为 ( 移 
动 于 、 作 出 决定 等 ) 特性 中 找到 了 GMOS。 事 实 上 LGMOS 的 发 展 起 初 只 被 认为 是 心理 学 主题 ， 
放样 GMOS 重 新 强调 了 人 类 特性 在 人 机 界面 设计 领域 中 ， 以 及 在 那些 从 传统 软件 工程 延伸 的 主 
题 中 所 起 的 作用 。 

在 可 预见 的 未 来 ， 人 机 界面 设计 表 定 是 一 个 活跃 的 研究 领域 。 处 理 当今 GUI 的 许多 问题 代 
然 没 有 得 到 解决 ， 大 量 附 加 问题 潜 存 于 三 维 界 面 的 使 用 中 《这 样 的 3D 界 面 已 经 出 现 )。 实 际 上 ， 
由 于 这 些 界面 承诺 包含 语音 和 与 三 维 视觉 的 触摸 交流 ， 所 以 潜在 问题 的 范围 是 巨大 的 ， 


问题 与 练习 

1 a 说 出 人 机 界面 设计 领域 中 的 人 体 工程 学 的 应 用 。 
b. 说 出 人 机 界面 设计 领域 中 的 知行 学 的 应 用 。 

2 人 机 界面 设计 与 更 传统 的 软件 工程 领域 有 什么 不 同 ? 

3 如 出 在 设计 人 机 界面 时 要 考虑 的 人 类 的 3 个 特征 。 








六 多 数 人 都 会 同意 这 样 一 个 观点 ， 即 公司 或 个 人 投资 开发 高 质量 的 软件 ， 都 希望 从 中 获 利 ， 
得 到 回报 。 许 多 人 指出 ， 如 果 没有 一 种 保护 这 种 投资 的 办 法 ， 那 么 就 很 可 能 没有 人 愿意 从 事 开 
发 社会 所 需 的 软件 的 工作 了 。 简 言 之 ， 软 件 开发 者 需要 对 他 们 生产 的 软件 拥有 相同 的 所 有 权 . 

提 估 这 种 所 有 权 的 法 律 措施 归 类 于 知识 产权 法 ， 其 中 许多 是 根据 完善 确立 的 版 权 法 和 专利 
法 原则 。 实 际 上 ， 版 权 和 专利 的 目的 是 允许 “产品 ”的 开发 者 在 向 公众 发 布 产品 时 能 保护 他 (或 
她 ) 的 所 有 权 。 但 是 ， 软 件 的 这 种 特性 已 经 导致 法 律 问题 的 频繁 出 现 ， 因 此 立法 机 构 正 致力 于 人 
改 软件 的 版 权 和 专利 的 相关 法 规 。 而 且 , 在 各 个 国家 间 对 这 种 法 律 的 接受 情况 有 着 极 大 的 不 同 ， 
(这 是 世界 贸易 组 织 要 处 理 的 问题 。) 

建立 版 权 法 的 最 初 目的 是 保护 作者 对 其 所 写作 品 的 权利 。 在 这 种 情况 下 ， 产 品 的 价值 并 不 
在 于 想法 本 身 ， 而 是 在 于 想法 是 如 何 表达 的 。 一 首 诗 的 价值 在 于 它 的 韵律 、 体 裁 以 及 格式 ， 而 
个 是 拓 主 目 ， 一 部 小 说 的 价值 在 于 作者 对 故事 的 描述 ， 而 不 是 故事 本 身 。 所 以 ， 对 诗人 或 小 说 
家 的 投资 的 保护 是 通过 对 他 们 想法 的 具体 表达 给 予 所 有 权 ， 而 不 是 想法 的 本 身 。 只 要 表达 方式 
与 原来 的 不 “雷同 ” 其 他 的 人 可 以 自由 地 表达 同样 的 思想 。 

向 而 言 之 ， 制 定 版 权 法 是 为 了 保护 形式 ， 而 不 是 保护 功能 。 但 是 ， 软 件 的 价值 通常 是 赤 于 
其 功能 ， 而 不 是 它 的 形式 。 所 以 ， 直 接 运用 版 权 法 不 见得 能 保护 软件 开发 者 的 投资 。- 般 来 说 ， 
法 耽 已 经 意识 到 了 这 个 问题 ， 并 已 经 接受 在 现行 版 权 法 下 给 予 软件 开发 者 公平 的 保护 的 尝试 
企 软 件 的 情况 中 ， 关 键 问题 在 于 确定 “雷同 ”的 具体 意义 。 
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如 傈 仅仅 因为 两 个 程序 完成 相同 的 任务 就 宣布 这 两 个 程序 是 “雷同 ”的 ， 这 未 免 太 轻率 了 。 
如 妥 这 样 做 ， 将 会 导致 一 个 后 果 ， 即 由 于 任何 操作 系统 的 任务 都 是 协调 计算 机 的 活动 和 对 资源 
进行 分 配 ， 央 此 ， 市 场 上 将 只 存在 一 种 操作 系统 。 但 是 ， 如 果 两 个 程序 的 基本 结构 〈 由 结构 图 
和 座 作 图 表示 的 ) 是 相同 的 ， 情 况 又 会 如 何 ? 这 是 否 可 以 视 为 阳 窃 呢 ? 例 如， 如 果 运 用 成 熟 的 
设计 模式 所 得 的 结果 具有 共同 的 结构 ， 那 么 两 者 的 类 似 性 仅仅 反映 出 了 这 两 个 程序 都 设计 得 比 
较 完 善 。 同 样 ， 两 个 程序 以 同一 种 方式 完成 一 个 任务 的 事实 可 能 仅仅 反映 这 样 一 个 现实 ， 即 对 
于 这 个 特定 的 应 用 ， 存 在 着 一 个 明显 的 算法 ， 而 不 是 侵犯 了 版 权 。 

为 了 处 理 这 类 问题 ， 法 院 采 用 了 所 谓 的 过 滤 技 术 ， 把 那些 不 表明 有 版 权 侵犯 的 类 似 地 方 与 
可 能 有 版 权 侵犯 的 地 方 区 分 开 来 。 这 个 过 滤 过 程 要 确定 一 些 不 隐 含 有 侵权 行为 的 特性 ， 移 出 这 
举 特 性 ， 然 后 依据 所 留 下 的 特征 来 判断 侵犯 行为 。 在 软件 方面 ， 因 标准 决定 的 特征 、 因 本 质 上 
由 程序 目的 的 逻辑 结果 表示 的 特征 以 及 公共 领域 软件 中 的 构件 等 ， 都 属于 过 滤 出 的 项 目 “ 所 以 
不 受 版 权 保护 )。( 这 种 决定 雷同 的 方法 是 一 些 包含 了 更 为 精确 的 法 律 程序 的 基本 思想 ， 法 律 术 
语 称 为 连续 过 滤 和 提取 测试 。) 

所 以 ， 如 果 这 些 范 围 内 的 相似 不 构成 版 权 侵犯 ， 那 么 什么 样 的 相似 才 构成 版 权 侵 犯 呢 ? 一 
学 起 诉 者 已 经 成 功 地 证 明了 软件 系统 的 外 观 应 当 得 到 版 权 法 保护 。 尽 管 “look and feel”〔 界 面 
外 观 ) 这 个 短语 直到 1985 年 才 使 用 。 但 是 ， 早 在 20 世纪 60 年 代 ， 这 个 概念 就 已 经 有 了 。 当 时 ， 
卫 M 会 司 推出 了 他 们 的 Systemy/360 系列 计算 机 ， 这 个 系列 包括 了 各 种 不 同 的 计算 机 ， 从 为 小 型 
商务 应 用 设计 的 计算 机 到 满足 大 型 商务 需求 的 计算 机 。 所 有 这 些 计算 机 所 配置 的 操作 系统 在 与 
其 环 过 通 信 时 ， 基 本 上 都 采用 同样 的 方式 。 也 就 是 说 ， 整 个 系列 的 计算 机 都 有 -一 个 标准 化 的 用 
户 界 面 。 这 样 一 来 ， 随 着 业务 的 增长 ， 可 以 换 用 360 系列 中 更 大 的 机 型 ， 而 不 必 重 新 编程 和 重 
新 培训 。 确 实 ， 在 360 系列 计算 机 中 ， 所 有 计算 机 的 外 观 〈 意 思 是 系统 软件 表现 出 来 的 样子 ) 
和 感觉 〈 意 思 是 用 户 与 系统 软件 之 间 交 互 方式 ) 都 是 相同 的 。 

到 如 今 ， 标 准 化 界面 的 优势 已 得 到 充分 的 认识 ， 整 个 软件 领域 都 在 寻求 这 种 标准 化 。 当 --- 
个 公司 设计 的 界面 受到 欢迎 时 ， 对 于 竞争 公司 而 言 ， 如 果 他 们 所 设计 的 系统 看 起 来 好 像 那个 芭 
名 的 公司 的 产品 ， 那 么 这 就 对 他 们 比较 有 利 了 。 这 种 相似 性 很 容易 使 得 那 家 著名 公司 的 客户 转 
而 炒 用 竞争 公司 开发 的 系统 ， 即 使 两 个 系统 的 内 部 设计 完全 不 一 样 也 不 要 紧 。 面 临 这 种 竞争 行 
为 的 会 司 已 经 寻求 版 权 法 的 保护 ， 声 称 拥有 原 系统 感 观 的 所 有 权 。 毕 竟 ， 软 件 包 的 感 观 具有 许 
多 受 版 权 法 保护 的 特征 。 

大 于 感 观 之 争 的 一 个 早期 案例 发 生 在 1987 年 ， 当 时 ，Lotus 公 司 起 诉 Mosaic 软 件 公司 ， 声 称 
后 者 抄 禾 了 其 Lotus 1-2-3 电 子 制 表 系统 的 感 观 ， 后 来 诉讼 成 功 。 然 而 ， 最 近 的 一 - 些 感 观 之 争 的 
案件 ， 其 结果 就 比较 混乱 。 例 如 ， 如 果 被 告 能 说 服 法 院 相信 ， 系 统 的 感 观 已 经 普遍 到 成 为 公共 
领域 里 的 一 个 标准 ， 那 么 这 个 感 观 就 要 被 过 滤 掉 ， 而 不 受 版 权 法 保护 。 

软件 是 一 种 有 些 特别 的 商品 ， 版 权 法 和 专利 法 都 能 用 在 它 身上 。 这 个 事实 有 时 候 让 法 院 难 
以 处 理 ， 担 心 对 版 权 解释 得 太 宽 而 又 会 与 专利 法 重 耕 。 

和 版 权 一 样 ， 当 利用 专利 来 保护 软件 所 有 权时 ， 同 样 也 遇 到 了 这 种 根本 性 的 问题 。 专 利 法 
己 经 建立 ， 它 允许 发 明 者 从 他 的 发 明 者 中 获得 商业 上 的 利益 。 为 了 获得 专利 ， 发 明 者 必须 透露 
安 明 的 细节 ， 并 说 明 这 是 新 的 、 有 用 的 ， 并 且 对 于 类 似 背景 下 的 其 他 人 不 是 轻而易举 做 到 的 。 
如 过 一 个 专利 被 授权 ， 那 么 在 一 段 有 限 的 时 期 内 发 明 者 就 被 赋予 了 权力 ， 防 止 其 他 人 制造 、 使 
用 、 销 售 或 引入 专利 。 这 段 时 间 一 般 是 专利 申请 被 提出 之 日 起 的 20 年 。 

获得 专利 的 一 个 障碍 是 长 期 存在 的 原则 ， 即 没有 人 能 够 获得 自然 现象 的 专利 (如 物理 法 则 、 
数学 公式 和 思想 一 一 诸如 此 类 ， 法 院 通常 会 支持 ， 包 括 算法 )， 而 且 去 辩论 一 个 新 软件 不 是 显 而 
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得 见 的 ， 可 能 也 是 很 困难 的 。 实 际 上 ， 新 软件 系统 发 明 者 经 常 做 的 是 花 时 间 和 精力 去 实现 已 经 
确立 的 原则 《如 果 他 们 乐意 提交 资源 这 样 去 做 ， 那 么 这 是 一 个 可 以 由 其 他 人 来 完成 的 过 程 )。 然 
而 ， 软 件 开发 者 成 功 获得 专利 的 事例 也 是 有 的 ， 其 中 一 个 例子 就 是 众所周知 的 RSA 加 密 算 法 ， 
今 它 被 大 量 地 用 在 许多 公 钥 加 密 系 统 中 。 

采用 专利 保护 软件 所 有 权 的 另 一 个 问题 是 ， 获 取 专利 是 一 个 昂贵 的 、 费 时 的 过 程 ， 通常 历 
时 儿 年 。 在 这 段 时 间 内 ， 软 件 产品 可 能 已 经 被 淘汰 了 ， 直 到 专利 批准 ， 申请 者 手中 只 有 人 靠不住 
的 权限 去 阻止 别人 人 盗 用 其 产品 。 

正如 前 面 提 到 的 ， 版 权 和 专利 是 为 了 设计 出 来 保护 发 明 者 和 开发 人 员 的 合法 利益 ， 这 样 他 
们 就 更 愿意 把 发 明和 成 就 用 于 公共 事业 ， 四 此 它 们 也 可 以 看 作 是 一 种 鼓励 信息 散布 的 方式 。 与 
之 相反 的 是 ， 行 业 保 密 法 则 提供 了 一 种 限制 想法 散布 的 方式 。 制定 这 些 法 规 是 为 了 维护 竞争 行 
业 间 的 道德 行为 ， 防 止 泄密 和 盗用 公司 的 内 部 成 果 。 公司 通常 通过 签署 保密 协议 来 保护 其 商业 
机 密 ， 协 议 规 定 : 能 够 接触 公司 机 密 的 员工 必须 保证 不 把 他 们 了 解 的 东西 向 他 人 泄露 。 法 庭 通 
单 会 支持 这 种 协议 。 

最 后 ， 我 们 应 当 提 出 责任 的 问题 。 软 件 开发 者 为 了 使 自己 免 于 责任 ， 他 们 通常 会 在 其 产品 
上 附带 免责 声明 ， 用 以 说 明 其 责任 的 限制 。 诸 如 “ 因 使 用 本 软件 所 造成 的 任何 损失 ， 本 公司 概 
不 负责 ”这 样 的 声明 比较 常见 。 然 而 ， 如 果 控 方 能 够 举 出 被 告 的 朴 忽 之 处 ， 法 庭 很 少 会 认可 这 
类 声明 。 所 以 ， 责任 案件 容易 集中 在 被 告 是 否 对 生产 的 产品 给 予 了 相应 的 关照 程度 。 一 个 在 开 
发 字 处 理 系统 的 情况 下 认为 可 以 接受 的 关照 程度 ， 如 果 放 在 核反应 堆 的 控制 软件 的 开发 上 ， 就 
可 能 认为 是 一 种 疏忽 ， 所 以 ， 对 软件 责任 声明 的 最 好 辩护 之 一 就 是 ， 在 软件 的 开发 过 程 中 ， 运 
用 了 合理 的 软件 工程 准则 ， 采 用 了 与 软件 应 用 相 适 应 的 关注 程度 ， 产生 了 验证 这 些 努力 的 维护 
记录 。 


问题 与 练习 
1. 什么 测试 能 够 被 用 来 确定 一 个 程序 是 可 与 另 一 个 程序 雷 间 ? 

2. 版 权 法 、 专 利 法 以 及 行业 保密 法 ， 这 些 法 规 的 制定 是 如 何 有 益 于 社会 ? 
3. 免责 声明 中 的 什么 内 容 将 不 会 被 法 庭 认可 ”? 
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复习 题 


( 带 *# 的 题目 涉及 选读 小 节 的 内 容 。) 


本 -4 


1 lw 


忆 


所 状 


. 从 出 一 个 例子 , 说 明 软 件 开发 时 所 做 的 努力 是 


如 何在 日 后 的 软件 维护 中 得 到 回报 的 。 


. 什么 是 演化 式 原 型 开发 ? 
弃 解 释 缺 少 度量 某 些 软件 特性 的 度量 学 是 如 


何 影响 软件 工程 学 科 的 。 

你 是 否认 为 度量 软件 系统 复杂 性 的 度量 标准 
年 积 标 的 ? 积累 的 意思 是 : 整个 系统 的 复杂 性 
是 其 各 部 分 的 复杂 性 之 和 ， 解 释 你 的 答案 。 


: 你 是 否认 为 度量 软件 系统 复杂 性 的 度量 标准 


是 可 交换 的 ? 可 交换 的 意思 是 : 如 果 系 统 最 初 
开发 了 X 特 性 ， 后 来 加 入 了 Y 特 性 ， 或 者 是 如 


二 原 先 开 发 了 Y 特 性 ， 后 来 增加 了 X 特 性 ， 那 


么 整个 系统 的 复杂 性 是 相同 的 ， 解 释 你 的 答 
案 


6. 软件 工程 是 如 何 区 别 于 诸如 电子 .机 械 工程 之 


类 传统 工程 领域 的 ? 


7. a 给 出 软件 开发 中 采用 传统 瀑布 模型 的 缺点 。 


b. 给 出 软件 开发 中 采用 传统 瀑布 模型 的 优点 。 


8. 开源 开发 是 一 个 自 顶 向 下 或 者 自 底 向 上 的 方 


法 学 吗 ? 请 给 出 你 的 答案 。 


?9 试 描述 常量 的 使 用 是 如 何 比 字面 量 的 使 用 更 


能 向 化 软件 维护 的 ? 


10. 划 合 和 内 聚 的 区 别 是 什么 ? 哪个 应 该 最 小 


化 ? 哪个 应 该 最 大 化 ? 为 什么 ? 


18. 


19. 


1 . 


. 从 日 日 生活 中 选取 一 个 对 象 , 依据 功能 内 聚 和 


远 辑 内 聚 来 分 析 其 组 成 部 分 。 


. 试 对 由 一 条 简单 的 goto 语 名 所 造成 的 两 个 程 


序 段 间 的 耦合 与 由 过 程 调 用 所 引起 的 耦合 进 
行 比较 。 


: 在 第 6 章 中 ， 我 们 已 经 知道 ， 参 数 可 以 通过 按 


值 传递 或 按 引 用 传递 这 两 种 方式 传递 给 过 程 。 
哪 一 种 提供 了 更 为 复杂 的 数据 耦合 形式 ? 请 
解释 你 的 答案 。 


: 如 果 一 个 大 型 的 程序 中 的 数据 元 素 都 设计 成 


全 局 数据 , 那么 在 修改 阶段 中 可 能 会 出 现 什么 
问题 ? 


:在 面 癌 对 象 程序 中 ， 声 明 一 个 实例 变量 是 公 


有 的 或 是 私有 的 对 数据 耦合 意味 着 什么 ? 
举 出 一 个 让 及 并 行 处 理 环 境 下 发 生 的 数据 耦 
合 的 问题 。 


. 接 如 下 结构 图 回答 下 列 问题 : 





a， 模 块 Y 把 控制 返回 到 哪个 模块 ? 

b. 模块 Z 把 控制 返回 到 哪个 模块 ? 

c. 模块 W 和 模块 灰 是 通过 控制 耦合 连接 起 来 的 
吗 ? 

d. 模块 W 和 模块 X 是 通过 数据 耦合 连接 起 来 
的 吗 ? 

e. 哪些 数据 是 由 模块 W 和 模块 Y 共 享 的 ? 

f 模块 Y 和 模块 入 以 什么 方式 相关 联 有 ? 

用 一 个 结构 图 来 表示 为 小 商店 (也 许 是 在 人 流 

量 较 大 的 社区 开 的 一 家 私人 古董 店 ) 开 发 的 一 

个 简 单 库存 /决算 系统 的 过 程 结构 。 请 问 ， 出 

于 营业 税 的 缘故 , 你 必须 要 修改 系统 中 的 哪些 

模块 ? 如 果 想 给 以 前 的 顾客 邮寄 广告 , 那么 当 

你 决定 要 维护 一 个 老 顾 客 的 记录 时 , 你 应 该 对 

哪些 模块 进行 修改 ? 

对 上 题 设 计 一 个 面向 对 象 的 解决 办 法 , 并 用 一 

个 类 图 进行 表示 。 


- 画 出 一 个 简单 的 类 图 ,表示 杂志 出 版 商 、 杂 志 


和 订阅 者 之 间 的 关系 。 
什么 是 UML? 


2 


过 各， 


29. 


3 


3 


上 一 


32. 


33. 
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男 出 一 个 简单 的 用 例 疼 , 描述 图 书馆 的 顾客 使 
用 图 书馆 的 方式 。 


. 请 本 出 一 个 序列 图 , 表示 当 公 用 事业 机 构 给 客 


户 发 送 账单 时 ， 继 而 发 生 的 交互 序列 。 


. 画 出 一 个 简 单 的 数据 流 图 , 用 来 描述 当 一 个 


交易 完成 时 , 目 动 库存 系统 里 所 出 现 的 数据 
流 。 


. 请 对 类 疼 所 表示 的 信息 与 序列 图 所 表示 的 信 


上 息 进 行 一 个 比较 。 


. 请 说 明 一 对 多 联系 与 多 对 多 联系 有 何不 同 ? 
.请 举 出 一 个 本 章 中 没有 提 到 的 一 对 多 联系 的 


例子 . 举 出 一 个 本 章 中 没有 提 到 的 多 对 多 联系 
的 例子 。 

基于 图 7-10 中 的 信息 , 想象 一 下 在 看 望 病人 的 
过 程 中 医生 和 病人 间 可 能 发 生 的 变 互 序列 。 画 
出 表示 这 个 序列 的 序列 图 。 

男 出 一 个 关 图 ,表示 饭店 里 服务 生 和 顾客 之 间 
的 关系 。 

请 画 出 一 个 类 图 , 用 来 表示 杂志 、 杂 志 出 版 商 
和 订阅 痢 之 间 的 关系 。 


- 扩展 图 7-5 中 的 序列 图 ， 显 示 这 样 的 序列 : 


Playera 成 功 地 返回 了 PlaverB 的 球 ， 但 
PlLaezryB 未 能 成 功 返 回 这 个 球 。 

基于 如 下 类 图 回答 下 列 问 题 , 类 图 表示 的 是 工 
其 、 它 们 的 用 户 以 及 它们 的 生产 三 商 间 的 关 





a， 哪个 其 〈X、Y 和 Z) 表示 工具 、 用 户 和 厂 
商 ， 验 证 你 的 答案 。 

b. 工具 能 被 多 于 1 个 用 户 使 用 吗 ? 

c. 工具 能 被 多 于 1 个 厂商 制造 吗 ? 

d4 是 否 是 每 个 用 户 使 用 仅 由 一 个 厂商 制造 的 
工具 ? 

根据 下 面 的 各 种 情况 , 判断 所 述 的 活动 是 与 序 

列 图 、 用 例 图 有 关 ， 还 是 与 类 图 有 关 。 

a， 确定 与 要 开发 的 系统 相关 的 数据 。 

b， 确 定 系 统 中 出 现 的 各 种 数据 项 之 间 的 联系 。 


“c, 确定 系统 中 每 个 数据 项 的 特性 。 


34. 


d 确定 哪些 数据 项 为 系统 中 各 个 部 分 共享 。 
基于 下 面 的 序列 图 ， 回 答 下 列 问 题 。 


35. 


36. 


37。 


让 于 于 于 本 三 二 天 利生 语种 后 才 生 5 生 本 时 下 5 和 二 | 且 和 E5UoCOOG 且 二 笨 me 


会 问题 
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a. 什么 类 含有 名 为 ww 的 方法 ? 

b. 什么 类 含有 名 为 xx 的 方法 ? 

c,， 在 序列 中 ，“ 类 型 ”Z 的 对 象 是 永远 与 “类 
型 ”YY 的 对 象 直接 地 通信 吗 ? 

请 画 出 一 个 序列 图 ， 说 明 对 象 A 调 用 对 象 B 中 

的 方法 bb，B 执 行 请 求 的 动作 ,返回 控制 给 A， 

然后 A 再 调用 对 象 B 中 的 方法 cc。 

扩展 对 前 面 问题 的 解决 方法 , 表明 只 有 当 变 量 

“continue” 为 真 时 ，A 才 能 调用 方法 bb， 在 B 

返回 空 之 后 ， 只 要 “continue” 继 续 为 真 ，A 

就 可 以 继续 调用 bb。 

请 画 出 一 个 类 图 , 用 来 描述 这 样 一 个 事实 ， 即 

卡车 《〈《Tmeck) 类 和 小 汽车 (Automobile) 类 

都 是 汽车 《Vehicle) 类 的 活化 。 


' 基于 图 7-12， 什 么 方法 应 用 包含 在 “类 型 ” 


PatientMedicalRecora 的 对 象 中 ? 


. 概述 设计 模式 在 软件 工程 中 的 作用 。 

- 请 举 出 软件 工程 领域 以 外 的 一 些 设计 模式 。 

- 总 结 设计 模式 在 软件 工程 中 的 作用 。 

. 在 什么 程度 上 来 说 , 一 个 典型 的 高 级 程序 设计 


语言 中 的 控制 结构 (如 if-then-else、 


Eee 





43. 


4 7. 


中 8， 


二 


while 等 ) 就 是 一 个 小 型 的 设计 模式 ? 

以 下 情况 中 , 哪个 涉及 了 帕 累 托 法 则 ? 并 解释 

你 的 答案 。 

a， 一 粒 老鼠 尿 搞 坏 一 锅 粥 。 

b. 每 个 电台 集中 于 一 种 特定 的 形式 ， 如 摇滚 
乐 、 古 典 音 乐 、 谈 话 节目 等 。 

c. 在 选举 活动 中 ， 候 选 人 非常 明智 地 将 其 重 
氮 放 在 上 次 投 他 们 票 的 那 部 分 选民 上 。 


: 软件 工程 师 希 望 大 型 软件 系统 在 错误 的 内 容 


上 是 同 种 类 型 的 , 还 是 不 同类 型 的 ? 请 解释 你 
的 答案 。 


- 串 盒 测试 与 白 盒 测 试 的 区 别 是 什么 ? 
: 试 举 出 一 些 在 软件 工程 以 外 的 领域 中 发 生 的 


与 圭 盒 测试 和 白 盒 测试 类 似 的 事件 。 

开放 源码 开发 与 beta 测 试 有 何 区 别 ? 《考虑 白 
盒 测 试 和 墨盒 测试 。) 

假定 在 一 个 大 型 系统 快要 完成 最 后 的 测试 前 ， 
故意 放 入 100 个 错误 。 此 外 ， 还 假定 在 最 后 的 
测试 期 间 发 现 并 纠正 了 200 个 错误 ， 而 其 中 的 
50 个 错误 属于 故意 放 入 系统 中 的 。 请 问 , 如 果 
接 下 来 那些 剩 下 的 50 个 已 知 错误 也 被 纠正 了 ， 
那么 你 估计 系统 中 还 有 多 少 个 没有 发 现 的 错 
误 ? 为 什么 ? 


. 什么 是 GOMS ? 
. 什么 是 人 体 工程 学 ? 什么 是 知行 学 ? 
. 在 什么 情况 下 , 传统 的 版 权 法 无 法 保护 软件 开 


发 者 的 投资 ? 


. 在 什么 情况 下 , 传统 的 专利 法 无 法 保护 软件 开 


公 者 的 投资 ? 





下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 这 些 问题 不 

征 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1.a. 分 析 员 玛丽 被 分 配 了 一 个 任务 ， 即 要 实现 一 个 系统 。 通过 该 系统 可 以 将 医疗 档案 存放 
在 联网 的 计算 机 上 。 依 据 她 的 观点 来 看 ， 系 统 安全 性 方面 的 设计 存在 着 缺陷 ， 但 是 ， 
由 于 公司 财政 方面 的 原因 ， 她 所 提出 的 想法 被 否决 了 。 而 且 她 还 被 告知 ， 使 用 她 认为 
个 太 合适 的 安全 系统 来 继续 该 项 目 。 这 种 情况 下 ， 她 该 怎么 办 ? 为 什么 ? 

b. 假设 分 析 员 玛丽 按照 吟 只 实 现 了 该 系统 ， 而 现在 ， 她 发 现 了 有 非 授 权 人 员 在 检索 医疗 
公案 。 这 时 她 该 怎么 办 ? 对 于 这 样 一 种 侵犯 安全 的 情况 ， 她 将 负 多 大 责任 ? 

c. 假设 分 析 员 玛丽 没有 听从 老板 的 安排 而 拒绝 再 开发 这 个 系统 ， 并 且 义 无 反 顾 地 将 设计 
缺陷 公布 于 众 ， 结 果 导 致 公司 的 财务 紧张 ， 许 多 无 辜 的 员工 失去 工作 。 分 析 员 玛丽 的 
行为 对 吗 ? 如 果 情 况 是 玛丽 仅仅 是 整个 设计 组 的 一 个 成 员 ， 她 并 不 了 解 公司 正在 花费 
大 的 精力 在 别 的 地 方 开发 了 一 套 有 效 的 安全 系统 ， 而 这 套 系 统 将 会 用 在 玛丽 正在 开发 
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的 系统 上 。 那 么 又 会 怎么 样 ? 这 种 情况 是 如 何 改变 你 对 玛丽 行为 的 判断 的 ?”《〈 需 要 注 
意 的 是 ， 玛 丽 对 这 种 情况 的 观点 和 以 前 一 样 。) 

. 当 一 个 大 型 软件 系统 由 许多 人 一 起 开发 时 ， 如何 双 配 责任 ? 是 否 有 一 种 层次 型 的 责任 ? 
是 否 有 不 同 程度 的 责任 ? 

. 我 们 已 经 看 到 ， 大 型 的 复杂 软件 系统 通常 是 许多 成 员 一 起 开发 的 ， 其 中 很 少 有 人 能 够 对 
整体 系统 有 一 个 全 整 的 了 解 。 那 么 对 于 一 名 员工 来 说 ， 他 对 系统 的 功能 没有 完全 了 解 ， 
却 要 为 该 项 目 出 力 ， 这 人 么 做 在 道德 上 是 否 合适 ? 

. 某 人 对 其 成 果 最 终 为 他 人 所 用 ， 应 当 负 多 大 的 责任 ? 

. 在 计算 机 专业 人 员 与 客户 之 间 的 关系 中 ， 专 业 人 员 的 责任 是 实现 客户 的 需求 ， 还 是 对 客 
户 的 需求 加 以 指导 ? 如 果 专 业 人 员 预 见 到 客户 的 要 求 会 导致 缺乏 职业 道德 的 结果 发 生 ， 
该 怎么 办 ? 例如 ， 客 户 可 能 为 了 提高 效率 希望 走 捷径 ， 而 专业 人 员 预 见 到 如 果 采 用 走 捷 
径 的 方式 ， 可 能 会 成 为 产生 数据 错误 或 系统 误 用 的 根源 。 如 果 客 户 坚持 这 么 做 ， 那 么 专 
业 人 员 是 否 承 没有 责任 ? 

. 如 全 技术 的 发 展 太 过 迅 儿 ， 发 明 者 还 未 来 得 及 从 他 的 发 明 中 获 利 ， 新 的 发 明 却 已 紧 随 而 
来 ， 取 而 代 之 。 这 样 将 会 发 生 什么 ? 这 种 获 利 对 推进 发 明 而 言 是 必需 的 吗 ? 开放 源码 开 
有 的 成 功 是 如 何 与 你 的 答案 有 什么 关系 ? 免费 的 软件 能 够 足以 支撑 现实 的 需求 ? 

7. 计算 机 革命 能 否 有 助 于 〈 或 者 说 帮助 解决 ) 世界 能 源 问 题 ? 对 其 他 的 一 些 大 规模 问题 ， 
如 饥饿 和 贫穷 等 ， 情 况 又 会 如 何 ? 

. 技术 是 否 会 无 限期 地 发 展 下 去 ? 是 否 有 什么 因素 会 道 转 社会 对 技术 的 这 种 依赖 ? 如 果 社 
会 继续 推进 技术 无 限期 地 发 展 下 去 ， 那 么 结果 将 会 怎样 ? 

9. 如 果 你 有 一 台 时 间 机 器 ， 你 想 要 生活 在 哪个 历史 时 间 段 中 ? 是 否 有 你 想 带 走 的 当前 技 

术 ? 一 种 技术 能 与 另 一 种 技术 分 开 吗 ? 为 了 防止 全 球 变 暖 而 不 接受 现代 医学 治疗 ， 这 个 
现实 吗 ? 


上 


Le 


L 有 -5 


局 
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半生 下 全 让 生生 村 TDP 村 二 有 PIG 王 二 半生 和 卫生 全 
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数据 抽象 


重 将 和 研究 的 是 如 何 对 数据 组 织 形式 进行 模拟 ， 这 门 学 科 称 为 数据 结构 ， 它 不 同 于 由 
计算 机 内 存 廊 提 供 的 以 一 个 个 单元 来 组 织 数据 的 方式 。 其 目标 是 允许 数据 的 使 用 者 将 
数据 集 视 为 一 种 抽象 的 工具 来 访问 ， 而 不 是 从 计算 机 内 存 中 的 数据 组 织 的 角度 去 考虑 问题 。 这 方 
面 的 研究 工作 将 向 我 们 展示 ， 构 造 这 种 抽象 工具 的 需求 是 如 何 产生 对 象 和 面向 对 象 编程 概念 的 。 


在 第 6 章 中 已 经 介绍 了 数据 结构 这 个 概念 。 在 那 一 章 中 , 我 们 已 经 了 解 到 ， 高 级 程序 设计 语 


言 所 提供 的 技术 使 程序 员 能 够 表示 算法 ， 使 得 所 操作 的 数据 感觉 好 像 并 不 是 按照 -- 个 个 单元 在 
让 存 中 人 存放。 我 们 还 学 习 到 ， 高 级 语言 所 支持 的 数据 结构 称 之 为 基本 结构 。 在 本 章 中 ， 我 们 将 
讨论 能 够 构建 和 操作 与 语言 的 基本 结构 不 同 的 数据 结构 的 一 种 技术 ， 该 研究 能 够 使 我 们 从 传统 
的 数据 结构 过 渡 到 面向 对 象 的 范 型 。 贯 穿 这 项 工作 进展 的 潜在 主题 是 抽象 工具 的 构建 。 
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8.1” 数据 结构 基础 
这 里 ， 先 介绍 一 个 基本 的 数据 结构 并 作为 后 续 几 节 的 例子 。 
8.1.1 数组 


在 6.2 节 中 , 已 经 介绍 了 同 构 数 组 和 异 构 数组 这 两 个 数据 结构 。 同 构 数 组 ( homogeneous arTay ) 
在 一 种 “矩形 的 ”数据 块 ， 其 项 具有 相同 的 类 型 。 具 体 来 说 ， 一 个 二 维 同 构 数 组 由 行 与 列 组 成 ， 
其 中 ， 项 的 位 置 是 由 一 对 下 标 确定 ， 即 第 一 个 下 标 值 确定 项 的 行 位 置 ， 第 二 个 下 标 值 确定 项 的 
- 列 位 置 。 例 如 ， 用 一 个 矩形 数组 来 表示 销售 人 员 的 每 月 销售 额 ， 每 行 的 项 代表 的 是 某 个 销售 人 
员 每 月 的 销售 额 ， 每 列 的 项 代表 的 某 个 月 每 个 销售 人 员 的 销售 额 。 这 样 一 来 ， 第 三 行 第 一 列 的 
项 就 可 以 表示 第 三 个 销售 人 员 第 一 个 月 的 销售 额 。 

与 同 构 数组 相对 ， 异 构 数 组 (heterogeneous array) 是 一 个 可 能 具有 不 同类 型 的 项 块 。 块 里 
的 项 通常 称 之 为 部 件 (component)。 例 如 ， 用 一 个 异 构 数 组 的 数据 块 表示 一 个 员工 ， 其 部 件 可 
能 有 三 项 : 员工 的 名 字 (字符 型 )、 年 龄 ( 整 型 ) 以 及 技能 等 级 〔 实 型 )， 


8.1.2 ” 表 、 栈 和 队列 


本 章 要 介绍 的 几 个 有 用 的 基本 数据 结构 例子 包括 表 和 树 。 表 (list) 是 这 样 的 一 组 数据 ， 其 
页 按 顺 序 排列 〈 见 图 8-1a)。 顾 客 清 单 、 购 物 清单 、 注 册 学 生 清单 以 及 库存 清单 都 属于 表 的 例 

子 。 一 个 表 的 开头 称 之 为 表 头 〈head)， 表 的 尾 端 称 之 为 表 尾 〈tail) 。 

几乎 所 有 的 数据 集合 都 可 以 看 成 列表 。 例 如 ， 文 字 可 以 被 看 成 符号 的 列表 ， 一 维 数 组 可 
以 看 成 是 行 的 列表 ，CD 上 记录 的 音乐 可 以 看 成 是 声音 的 列表 。 更 为 传统 的 例子 包括 客人 清 
单 、 购 物 清 单 、 班 级 注册 表 、 存 货 表 等 。 与 列表 相关 的 操作 视 情况 而 定 。 在 某 些 情况 下 ， 我 
们 可 能 需要 从 列表 中 移 除 项 ， 向 列表 中 增加 项 ， 每 次 “处 理 ” 列表 中 的 一 个 项 ， 都 要 改变 项 
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在 列表 中 的 排列 , 或 者 也 许 是 查找 某 个 特殊 的 数据 项 是 否 在 列表 中 。 我 们 将 在 本 章 的 后 面 讨 
论 这 些 操作 。 

通过 产 格 限制 表 中 的 项 的 访问 方式 ， 我 们 可 以 得 到 两 种 特殊 类 型 的 表 ， 称 为 栈 和 队列 。 杰 
(stack) 是 这 样 的 一 种 表 ， 该 表 的 项 只 能 在 表 头 进行 添加 和 删除 〔 见 图 8-lb)。 用 遂 俗 的 术语 来 
表示 ， 栈 的 头 称 之 为 栈 顶 〈top)， 栈 的 尾 称 之 为 栈 底 〈bottom 或 base)。 一 个 例子 就 是 桌子 上 放 
书 的 栈 ， 通 过 在 栈 顶 放 书 来 增加 一 本 书 ， 在 栈 顶 移出 一 本 书 来 减少 一 本 书 。 在 栈 顶 增加 一 个 新 
的 项 称 之 为 入 栈 (pushing) 一 个 表 项 ， 在 栈 顶 删除 -一 个 项 称 之 为 出 楼 (popping) 一 个 表 项 。 注 
意 到 ， 最 后 入 栈 的 数据 最 先 出 栈 ， 这 样 就 可 以 得 到 ， 栈 是 所 谓 的 后 进 先 出 〈1last-in ， first-out， 
LIFO， 读 作 “LIE-foe”) 的 结构 。 

对 于 那些 检索 次 序 与 存储 次 序 相 反 的 存储 数据 项 而 言 ， 这 种 后 进 先 出 特性 意味 着 栈 是 理想 
的 ， 所 以 栈 经 常 被 用 做 回溯 活动 的 支撑 。( 术 语 回潮 backtracking) 是 指 退 出 系统 的 过 程 ， 它 
与 进入 系统 的 次 序 相 反 。 一 个 经 典 的 例子 是 ; 为 了 找到 走出 森林 的 路 径 而 原 路 折 回 。) 例如 ， 思 
考 一 下 支撑 递归 过 程 所 需要 的 基本 结构 ， 在 每 一 个 新 活动 开始 时 ， 先前 的 活动 必须 保存 下 来 。 
和 而且 ， 在 每 一 个 活动 结束 时 ， 必 须 检索 前 一 个 被 保存 的 活动 。 这 样 ， 如 果 当 活动 被 保存 时 就 会 
压 入 栈 中 ， 那 么 每 次 需要 检索 一 个 活动 时 ， 合 适 的 活动 将 处 在 栈 顶 。 

队列 “queue) 是 这 样 的 一 种 表 ， 其 表 项 只 能 从 表 头 删除 ， 新 表 项 只 能 从 表 尾 增加 。 这 种 
数据 结构 的 例子 有 ， 戏 院 门口 的 一 个 排队 等 待 购 票 的 人 群 《 见 图 8-1lcy， 这 里 ， 队 列 头 的 人 先 
购 系 ， 而 新 到 的 人 必须 到 队 尾 进行 排队 购 票 。 在 第 3 音 中 ， 我 们 已 经 遇 到 过 这 种 数据 结构 ， 在 
那 节 中 可 以 看 到 ， 批 处 理 系 统 所 存放 的 作业 必须 在 所 谓 的 作业 队列 中 进行 排队 ， 等 待 执行 。 
问 梓 的 可 以 得 出 这 样 的 结论 ， 与 栈 不 同 ， 先进 队列 的 项 会 先 从 队列 中 删除 ， 就 是 说 队列 是 先 
进 先 出 〈first-in，first-out，FIFO， 读 作 “FIE-foe”) 的 结构 ， 这 意味 着 表 项 以 它们 存储 的 顺序 
从 队列 中 删除 。 

正如 第 1 章 中 介绍 的 ， 队 列 常 被 用 作 缓冲 区 的 基本 结构 ， 缓冲 区 是 从 一 处 传送 到 另 一 处 的 数 
据 临时 放置 的 存储 区 域 。 当 一 项 数据 到 达 了 缓冲 区 ， 它 就 被 放置 在 队列 的 末尾 。 当 需要 转发 数 
据 项 到 达 最 终 的 目的 地 时 ， 它 们 按 其 在 队列 头 部 出 现 的 次 序 被 转发 . 因此 ， 数 据 转发 的 次 序 就 








是 它们 到 达 的 次 序 。 
队列 
J 训 表 头 | 局 
Bob 
表 ， -| 
Devon 全 大 人 从 当 票 口 
Maurice 一 一 表 尾 一 人 栈 底 队 | Te 陵 汪 
(aj 一 个 名 字 表 {b) 一 个 书 的 栈 (c) 一 个 人 群 的 队列 
图 8-1 表 、 栈 和 队列 
8.1.3 树 


枫 〈tree) 是 这 样 的 一 个 数据 集合 ， 其 项 具有 层次 化 的 组 织 形 式 ， 很 像 一 个 典型 的 公司 组 织 
关系 图 〈 见 图 8-2)。 这 种 组 织 图 中 ， 项 部 表示 总 裁 ， 由 分 支线 下 连 到 副 总 裁 ， 副 总 裁 又 连 到 地 
区 经 理 等 等 。 对 树 的 这 种 直觉 人 性 的 定义 ， 我 们 还 要 加 上 一 个 限制 性 条 件 ， 即 〈 参 照 组 织 图 ) 公 
司 的 任何 一 个 员工 具 对 一 个 上 级 负责 。 也 就 是 说 ， 组 织 中 的 不 同 分 支 不 会 在 下 一 层 相 遇 。( 第 6 
章 已 经 举 过 几 个 树 的 例子 ， 是 以 语法 分 析 树 的 形式 介绍 的 。) 
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图 8-2 组 织 图 的 一 个 例子 


树 中 的 每 一 个 位 置 称 为 一 个 结 点 〈node) 〈 见 图 8-3)。 树 顶部 的 那个 结 点 称 为 根 结 点 〈root 
node)《“ 如 采 我 们 把 图 倒 过 来 看 ， 这 个 结 点 就 表示 了 树 的 根 )。 另 一 端点 处 的 结 点 称 为 终端 结 点 
(terminal node)， 有 时 也 称 为 叶子 结 点 〈leaf node)。 我 们 常 将 从 根 到 叶子 的 最 长 路 径 上 的 结 占 
数 称 为 树 的 深度 〈depth)。 换 名 话说， 一 个 树 的 深度 就 是 该 树 所 包含 的 层 数 ， 374 


根 缚 点 








子 树 


旺 终端 结 点 《或 叶子 早点 ) 
图 8-3 树 的 术语 


有 时 候 ， 我 们 会 提 到 这 样 一 种 树 结构 ， 该 树 的 每 个 结 点 派生 出 其 直接 下 层 的 结 点 。 所 以 常 
第 会 说 到 一 个 结 点 的 祖先 和 后 代 。 这 里 ， 称 一 个 结 点 的 直接 后 代为 子 (echildren ) 结 点， 称 其 直 
接 祖 先 为 父 〈parent) 结 点 。 而 将 有 同一 个 父 结 点 的 那些 结 点 称 之 为 兄弟 《siblings) 结 点 。 如 
. 染 一 个 本 的 每 个 父 结 点 有 不 多 于 两 个 的 子 结 点 ， 那 么 称 该 树 为 二 叉 树 (binary tree )。 

如 果 选 择 一 棵 树 中 的 任意 一 个 结 点 ， 该 结 点 与 其 下 层 的 那些 结 点 也 构成 了 一 个 树 结构 ， 那 
么 怠 称 这 些 较 小 的 结构 为 子 树 〈(subtree)。 这 样 一 来 ， 每 个 子 结 点 就 是 其 父 结 点 下 面 的 子 树 的 根 
结 点 ， 这 样 的 子 树 称 为 父 结 点 的 一 个 分 支 (branch)。 在 二 叉 树 中 ， 在 提 到 树 的 显示 方式 时 我 们 
经 党 会谈 到 ， 一 个 结 点 的 左 子 树 和 右 子 树 。 


问题 与 练习 
1 针对 以 下 每 一 个 结构 : 列表 、 栈 、 队 列 和 树 ， 举 出 例子 〈 计 算 机 科学 以 外 的 )。 


名 
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- 加 结 出 列表 、 栈 及 队列 间 的 区 别 。 

- 假 庆 A 字 母 被 放 入 一 个 空 栈 中 ， 然 后 依次 是 字母 B 和 C， 再 假设 一 个 字母 出 栈 ， 字 母 D 和 E 入 栈 。 请 将 
栈 中 字母 按照 出 现 的 自 顶 向 下 的 顺序 排列 出 来 ， 如 果 一 个 字母 要 出 栈 ， 哪 个 字母 将 被 检索 ? 

: 假设 字母 A 放 入 一 个 空 的 队列 中 ， 然 后 依次 是 字母 B 和 C。 再 假设 此 队列 中 一 个 字母 被 移出 ， 之 后 持 
人 字母 D 和 E。 请 按照 字母 在 队列 中 从 表 头 到 表 尾 出 现 的 顺序 列 出 它们 。 如 果 此 时 再 要 从 队列 中 移出 

小 宇 母 ， 应 该 是 哪个 字母 ? 

: 假 谨 一 个 树 有 4 个 节点 : A、B、C 和 D。 如 果 A 和 C 是 兄弟 ， 而 D 的 父 节 点 是 A， 哪些 节点 是 叶 节 点 ? 
哪些 节点 是 根 节 点 ? 


Le 


必 


f 


ER 全 二 站 二 ae 让 四 Hi 二 CT 二 目 且 1 和 语 -RE 于 入 汪 全 | 市 二 站 -后 起 相 下 下 主 PU<RRTE 


8.2 ”相关 概念 
在 本 节 中 ， 我 们 分 别 讨论 3 个 与 数据 结构 紧密 相关 的 主题 ， 抽象 、 静态 与 动态 结构 间 的 区 别 





以 及 指针 的 概念 。 


8.2.1 抽象 


前 面 小 节 呈 现 的 数据 结构 常 与 计算 机 内 存 中 所 存储 的 数据 有 关 。 但 是 计算 机 的 内 存 并 不 是 
按照 数组 、 表 、 栈 、 队 列 和 树 这 样 的 结构 来 组 织 的， 而 是 顺序 地 组 织 成 一 组 可 寻 址 的 存储 单元 。 
这 样 一 来 ， 所 有 的 其 他 结构 都 必须 进行 模拟 。 如 何 完成 这 种 模拟 工作 是 本 章 的 主题 。 到 现在 为 
止 ， 我 们 只 是 指出 ， 诸 如 数组 、 表 、 栈 、 队 列 和 树 这 样 的 组 织 都 是 些 抽象 工具 ， 之 所 以 构造 这 
皮 抽 象 工具 ， 是 为 了 使 数据 的 用 户 不 用 关心 实际 数据 存储 的 细节 ， 这 样 信息 就 好 像 是 以 一 种 生 
为 便利 的 形式 进行 存储 的 ， 便 于 用 户 访问 。 

在 这 里 ， 用 户 这 个 术语 并 不 一 定 指 的 是 人 ， 这 个 词 的 含义 因 视角 不 同 因 时 而 异 。 如 果 从 -- 
个 使 用 PC 机 来 维护 保龄球 比赛 记录 的 人 的 角度 考虑 ， 那 么 用 户 就 是 一 个 人 。 在 这 种 情况 下 ， 应 
用 软件 〈 也 许 是 电子 制 表 软件 包 ) 将 负责 把 数据 用 人 觉得 方便 的 抽象 形式 表示 出 来 〈 很 可 能 与 
同 构 数组 类 似 )。 如 果 从 因特网 上 的 一 个 服务 器 角度 考虑 ， 那 么 这 时 的 用 户 可 以 是 一 个 客户 端 ， 
在 这 种 情况 下 ， 服 务 器 将 负责 把 数据 表示 成 有 利于 客户 端的 抽象 形式 。 如 果 从 程序 的 模块 结构 
来 考虑 ， 那 么 用 户 应 该 是 需要 访问 这 些 数据 的 任何 模块 。 在 这 种 情况 下 ， 模 块 所 包含 的 数据 应 
该 负责 把 数据 表示 成 有 利于 其 他 模块 的 抽象 形式 。 所 有 这 些 情 况 中 ， 有 一 条 共同 的 主线 ， 那 就 
征用 户 拥 有 将 数据 作为 一 个 抽象 工具 来 访问 的 特权 。 


8.2.2 ”静态 结构 与 动态 结构 


构建 抽象 数据 结构 中 的 一 个 重要 区 别 是 ， 所 模拟 的 结构 是 静态 的 还 是 动态 的 。 也 就 是 说 ， 
结构 的 形状 或 大 小 是 否 会 随时 间 改 变 。 例 如 ， 如 果 这 个 抽象 工具 是 一 个 名 字 清 单 ， 那 么 考虑 以 
下 情况 将 非常 重要 : 这 份 名 字 清 单 是 会 一 直 保持 固定 的 大 小 ， 还 是 可 能 因 名 字 的 增加 和 删除 而 
膀 胀 和 收缩 。 

各 “ 般 规 律 而 言 ,静态 结构 比 动态 结构 更 容易 处 理 。 如 果 一 个 结构 是 静态 的 ， 那 么 仅仅 
再 要 提供 一 种 能 够 访问 结构 中 不 同 项 的 方法 就 可 以 了 , 也 许 就 是 能 改变 指定 位 置 的 数据 值 的 
方法 。 但 是 ， 如 果 结 构 是 动态 的 ， 那 就 必须 要 处 理 增加 和 删除 项 的 问题 ， 还 要 找到 因数 据 结 
构 增 长 所 需 的 存储 空间 。 在 结构 设计 不 合理 的 情况 下 ， 增加 一 个 新 的 单项 可 能 会 导致 对 结构 
进行 入 规模 的 重 排 , 而 且 结构 的 过 度 增长 可 能 会 迫使 整个 结构 转移 到 另 -- 个 可 用 空间 和 更 大 的 
仔 储 区 域 。 
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8.2.3 ”指针 


我 们 知道 计算 机 内 存 中 各 种 不 同 的 单元 是 由 数字 地 址 来 标识 的 。 作 为 数值 ， 这 些 地 址 本 身 
吕 可 以 进行 编码 ， 存 放 在 内 存单 元 中 。 指 针 〈pointer) 是 一 个 存储 区 ， 包 含 了 这 样 的 被 编码 过 
的 地 址 。 在 数据 结构 的 情况 中 ， 指 针 用 来 记录 项 存放 的 位 置 。 例 如 ， 如 果 我 们 必须 要 不 断 地 将 
一 个 项 从 一 个 位 置 移 到 另 一 个 位 置 ， 那 么 我 们 可 以 指定 一 个 固定 的 位 置 ， 将 其 作为 指针 。 这 样 
一 来 ， 每 次 移动 该 项 时 ， 就 能 够 通过 更 新 这 个 指针 来 反映 数据 的 新 地 址 。 接 下 来 ， 当 要 需要 访 
问 该 项 时 ， 我 们 就 可 以 通过 指针 来 找到 该 项 。 事 实 上， 指针 将 一 直 指 向 数据 。 

在 第 2 章 学 习 CPU 的 过 程 中 ， 我 们 已 经 遇 到 过 指针 这 个 概念 。 在 那 一 章 中 ， 我 们 可 以 看 
到 ， 一 个 称 为 程序 计数 器 的 寄存 器 被 用 来 存放 下 一 条 要 执行 的 指令 的 地 址 。 所 以 ,程序 计数 
器 喜 起 到 了 指针 的 作用 。 事 实 上 ， 程 序 计数 器 的 另 一 个 名 字 叫 作 指令 指针 (instruction 
pointer ) 。 

举 一 个 指针 应 用 的 例子 ， 假 设 在 计算 机 内 存 中 ， 按 书目 的 字母 顺序 存放 着 小 说 的 清单 。 虽 
然 在 许多 应 用 场合 ， 这 样 的 安排 比较 方便 ， 但 是 如 果 要 寻找 某 个 作者 的 所 有 小 说 作品 就 比较 困 
难 了 ， 因 为 它们 分 散在 整个 表 中 。 为 了 解决 这 个 问题 ， 可 以 在 表示 每 本 小 说 的 的 存储 单元 块 中 
保留 一 个 额外 的 存储 单元 ， 并 将 该 存储 单元 用 作 一 个 指针 ， 指 向 表示 同一 作者 另 一 本 小 说 的 存 
储 块 。 通 过 这 种 方法 ， 同 一 作者 的 所 有 小 说 就 可 以 链接 成 一 个 环 〔〈 见 图 8-4)。 一 旦 找到 给 定 作 
者 的 一 本 小 说 ， 我 们 就 可 以 循 着 指针 一 本 接 另 一 本 地 找到 该 作者 的 其 余 所 有 小 说 。 











沟 明 威 : 永别 了 ， 翅 器 海明威 ， 丧钟 为 谁 而 鸣 海明威 : 太阳 依旧 升 起 








指针 指针 







本 / 
图 8-4 按 书 名 排列 而 根据 作者 链接 的 小 说 

现代 的 许多 程序 设计 语言 都 把 指针 作为 一 种 基本 的 数据 类 型 。 也 就 是 说 ， 就 像 对 整数 、 字 
符 串 那样 ， 程 序 设计 语言 也 可 对 指针 进行 声明 、 分 配 以 及 操作 。 利 用 这 种 语言 ， 程 序 员 就 能 在 
计算 机 存储 器 中 ， 把 相关 的 项 用 指针 相互 链接 起 来 ， 从 而 就 可 以 设计 出 精巧 的 数据 网 。 


问题 与 练习 

1. 数组 、 表 、 栈 、 队 列 和 树 等 数据 结构 在 何 种 意义 上 是 抽象 的 ? 

2 请 举 出 一 个 涉及 静态 数据 结构 应 用 的 例子 。 再 举 出 一 个 涉及 动态 数据 结构 应 用 的 例子 
3. 请 举 出 在 计算 机 科学 领域 外 出 现 指针 这 个 概念 的 例子 。 


本 市 于 站 可 证 E 下 于 | 司 昌 人 证 于 且 : 六 站 HE 着 玫 让 有 TO 下 和 让 PrE 一 证 证 和 了 本 本 后 汪 HT Je -有 玉 下 通 和 证 站 让 卫 下 FT 证 再 拓 | 本 二 ET TI 


现在 我 们 来 讨论 8.1 节 所 介绍 的 一 些 数据 结构 在 计算 机 主 存 中 的 存储 方式 。 
8.3.1 数组 的 存储 


我 们 首先 讨论 存储 数组 的 技术 。 正 如 第 6 章 所 介绍 的 ， 在 高 级 程序 设计 语言 中 ,常常 将 这 些 
结构 作为 基本 结构 来 提供 。 在 此 ， 我 们 的 目标 就 是 要 理解 如 何 将 处 理 这 些 结构 的 程序 翻译 成 用 


377 


了 


人 
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来 处 理 存 放 在 内 存 中 的 数据 的 机 器 语言 程序 。 

1， 同 构 数 组 

假设 要 存储 一 个 24 小 时 温度 的 读数 序列 ， 每 个 读数 需要 存储 空间 的 一 个 存储 单元 。 而 且 ， 
假设 依据 它们 在 序列 中 的 位 置 来 确定 这 些 读数 。 也 就 是 说 ， 我 们 要 能 够 访问 第 1 个 读数 或 者 是 第 
5 个 读数 。 简 单 来 说 ， 就 是 要 按照 一 维 同 构 数组 的 方式 来 处 理 这 个 序列 ， 

这 里 ， 只 要 将 这 些 读 数 按 顺 序 存放 在 具有 连续 地 址 的 24 个 存储 单元 中 ， 就 可 以 实现 这 个 目 
标 了 。 于 是 ， 如 果 这 个 序列 中 第 1 个 单元 的 地 址 是 xr， 那么 任何 一 个 指定 温度 读数 可 以 这 样 计 算 
得 到 , 即 扩 要 读数 的 序号 减 去 1, 然后 将 计算 的 结果 加 上 x*。 具 体 来 说 ， 第 4 个 读数 就 放 在 x+(4-T 
这 个 地 址 中 ， 如 图 8-5 所 示 。 


地 址 一 -一 | 天 其 寺 | 扣 小 二 沽 十 三 谢 填 司 


存储 元 一 | 


民 扎 吕 本 ng8S [1 ] 
及 忆 直 岂 工 下 可 卓 [ 立 ] 
Reaeinaos[31] 
民 忆 己 本 1LnGSE [d4] 
图 8-5 ”存放 在 存储 器 中 的 温度 读数 数组 ， 起 始 地 址 为 x 
这 种 技术 为 大 多 数 高 级 程序 设计 语言 的 翻译 程序 所 采用 ， 用 以 实现 一 维 同 构 数 组 。 当 翻译 
程序 遇 到 下 面 这 样 的 声明 语句 时 : 


Int Readings[241]:; 


-这 就 表明 ，Readings 这 个 术语 是 指 可 以 存放 24 个 整数 的 一 维 数组 ， 这 时 ， 翻 译 程序 就 会 安排 预 


留 24 个 连续 的 存储 单元 。 以 后 在 程序 中 ， 如 果 遇 到 赋值 语句 
Readlngs [4] 呈 67; 


则 要 求 将 值 67 放 入 数组 Readings 的 第 4 项 中 。 此 时 ， 翻译 程序 就 生成 了 一 串 机 器 指令 ， 把 值 67 
放 入 地 址 为 x+(4-DJ) 的 存储 单元 中 ， 其 中 zx 为 与 数组 Readings 相 关 的 存储 块 的 第 一 个 单元 的 地 
丝 。 通 过 这 种 方式 ， 程 序 员 在 编写 程序 的 时 候 ， 就 可 以 认为 温度 读数 确实 存放 在 一 个 一 维 数组 
中 。(〈 注 意 ， 在 C、C++、C# 及 Java 语 言 中 ， 数组 的 下 标 是 从 0 而 不 是 从 1 开始 的 ， 这 样 一 来 ， 第 4 
个 读数 应 该 由 Readings [3] 表 示 。 见 本 节 末 的 问题 与 练习 3。) 

现在 ， 假 设 我 们 要 记录 一 个 公司 的 销售 人 员 一 周 内 的 销售 业绩 。 在 这 种 情况 下 ， 可 以 想象 
将 数据 安排 成 一 个 二 维 同 构 数 组 。 该 数组 中 ， 每 行 的 值 表示 某 个 员工 的 销售 业绩 ， 而 每 列 中 的 
值 表 示 某 一 天 内 所 有 的 销售 业绩 。 

为 了 实现 这 种 要 求 ， 首 先 认识 到 ， 这 个 数组 是 静态 的 ， 即使 它 的 内 容 得 到 更 新 ， 其 大 小 也 
不 会 改变 。 所 以 吏 可 以 计算 出 存放 整个 数组 所 需 的 存储 区 的 总 量 ， 然后 就 保留 这 样 大 小 的 一 块 
连续 存储 单元 。 接 下 来 就 一 行 一 行 地 把 数据 存 入 数组 ， 从 所 保留 的 存储 块 的 第 1 个 起 ， 把 数组 第 
1 行 数值 存 进 连续 的 存储 单元 ， 接 着 存放 下 一 行 ， 再 下 一 行 ， 以 此 类 推 〈( 见 图 8-6)。 这 样 一 种 存 
储 系 统称 之 为 行 主 序 (row major order) 系统 。 与 之 相反 的 是 ， 如 果 数 值 按照 一 列 接着 一 列 地 存 
放 ， 则 称 为 列 主 序 〈column maior order) 系统 。 
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概念 数组 





第 3 行 第 4 列 的 项 
图 8-6 ”以 行 主 序 存储 的 一 个 4 行 5 列 二 维 数组 
如 采 数 据 以 这 种 方式 存放 ， 那 么 考虑 一 下 ， 如 何 找到 数组 中 的 第 3 行 第 4 列 的 数值 ?设想 一 
下 ， 我 们 处 在 所 保留 的 机 器 存储 块 的 第 1 个 单元 。 从 这 个 位 置 起 ， 可 以 依次 找到 数组 第 1 行 的 数 
据 ， 接 者 是 第 2 行 ， 然 后 是 第 3 行 ， 依 次 类 推 。 要 得 到 第 3 行 的 数据 ， 我 们 必须 先 经 过 第 1 行 和 第 2 
行 。 由 于 每 一 行 有 5 个 项 〈 星 期 一 至 星期 五 ， 每 天 一 个 项 )， 因 此 要 访问 到 第 3 行 的 第 一 个 项 ， 必 
痪 经 过 一 共 10 个 项 。 从 那儿 起 ,我 们 还 必须 再 过 去 3 个 项 , 才能 到 达 第 3 行 第 4 列 的 那个 项 。 这 样 ， 
为 了 到 这 第 3 行 第 4 列 的 项 ， 从 存储 块 的 开始 处 总 共 需 要 经 过 13 个 项 。 
上 述 的 计算 过 程 可 以 概括 为 一 个 公式 ， 即 可 以 将 行列 位 置 的 坐标 转换 为 实际 的 存储 器 地 址 。 
具体 来 说 ， 如 果 令 c 表 示 一 个 数组 的 列 数 〈 也 就 是 每 行 所 包含 的 项 的 个 数 )， 那 么 第 ; 行 第 / 列 项 的 
地 址 就 可 以 表示 为 : 


x+CX 人 1))+( 产 1 


其 中 ，z 是 放 第 1 行 第 1 列 项 的 单元 地 址 。 也 就 是 说 ， 必 须 经 过 -1 行 〈 每 行 包 括 c 个 元 素 )， 才 能 
到 达 第 厅 ， 然 后 再 经 过 广 ! 个 项 ， 才 能 到 达 这 行 的 第 /个 项 。 上 面 的 例子 中 ，c<5，=3，F4， 所 以 ， 
如 果 数 组 从 地 址 zx 进行 存 放 ， 那 么 第 3 行 第 4 列 的 项 的 地 址 就 应 该 为 zxH(5x(3-1))H(4-1)=x+13 。 
表达 式 (cx(G-ID)+-I 有 时 候 称 为 地 址 多 项 式 (address polynomial)。 

这 也 是 大 多 数 高 级 程序 设计 语言 的 翻译 程序 所 采用 的 技术 。 当 遇 到 声明 语句 


1Inmt Sales[8,5]: 


时 ， 则 表明 : sales 是 一 个 8 行 5 列 的 二 维 整数 数组 ， 翻 译 程序 就 会 保留 40 个 连续 的 存储 单元 。 
以 后 如 果 遇 到 赋值 语句 


Sales[3,4] 全 5; 


则 需要 将 数值 5 放 到 数组 sales 的 第 3 行 第 4 列 的 那个 项 中 ， 此 时 ， 就 产生 一 串 机 器 指令 ， 将 数值 5 
放 到 地 址 为 x+ 〈5x(3-1)) + (4-1) 的 存储 单元 中 ， 其 中 ， xz 是 与 数组 sales 相 关联 的 存储 块 的 第 1 
个 单元 的 地 址 。 通 过 这 种 方式 ， 程 序 员 编写 程序 时 ， 就 好 像 销 售 量 确实 存放 在 一 个 二 维 数 组 中 。 
2， 异 构 数 组 
现在 ， 假 设 要 存储 的 异 构 数 组 称 为 Bmployee， 该 数组 包含 3 个 部 件 ，Name (字符 型 )，aAge 
( 整 型 )，Skill1Rating【〔 实 型 )。 如 果 数 组 中 的 每 个 部 件 所 需 的 存储 单元 的 数目 是 固定 的 ， 那 
么 驶 可 以 将 数组 存放 在 一 个 连续 的 单元 块 中 。 例 如 ， 假设 Name 部 件 最 多 需要 25 个 单元 ，aAge 只 
青 要 一 个 单元 ，skil1Rating 也 只 需 一 个 单元 。 于 是 ， 我 们 就 可 以 预 留 出 一 个 27 个 连续 单元 的 
存储 块 ， 开 始 的 25 个 存储 单元 用 来 存放 员工 的 名 字 ， 第 26 个 存储 单元 用 来 存放 员工 的 年 龄 ， 最 
后 一 个 存储 单元 用 来 存放 员工 的 技能 等 级 〈 见 图 8-7a)。 
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正 m 加 1 已 wy 所 已 


下 mD] DY 人 已, Narme 及 mi] 口 W 后 司 . 丰 训 和 巨 mh 记 二 品 Yee . 忆 KI TI 民 电 上 站 可 






地 址 : 


世 胃 加 上 总 Y 呈 所 . 玖 忆 下 所 


瑟 和 证 站 Y 合生 . 让 训 已 


指针 





已 N 记 二 己 闻 全 所 . 号 长 工 及 半 七 斌 症 操 


(pb) 存放 在 不 同位 置 的 数组 部 件 
图 8-7 ”存储 同 构 数 组 Emplovee 


通过 这 种 安排 ， 就 可 以 很 容易 地 访问 该 数组 中 不 同 的 部 件 。 例 如 ， 如 果 第 一 个 存储 单元 的 
地 址 是 xz， 那么 指向 Employee.Name (意思 是 Employee 数 组 中 的 Name 部 件 ) 任何 的 引用 都 将 
转移 到 从 地 址 zx 开始 的 25 个 存储 单元 ， 而 指向 Emplovyee .age ( 意思 是 Employee 数 组 中 的 Age 
部 件 ) 的 引用 将 转移 到 地 址 x +25 的 存储 单元 。 具 体 来 说 ， 如 果 翻 译 程序 遇 到 了 高 级 语言 中 的 这 
样 一 条 语 和 名， 

ErmpJ] 局 Yee 。 三 呆 所 二 22; 


烤 么 只 要 产生 一 系列 机 器 语言 指令 ， 用 以 将 数值 22 放 入 地 址 为 x+25 的 存储 单元 或 者 说 ， 如 果 将 
Emp1cyeeOfMonth 定 义 为 一 个 与 之 类 似 的 数组 ， 并 将 其 存放 在 地 址 为 ?的 存储 块 上 ， 那么 语句 


LOPEmPJLIoyeeDfMonth < 二 EmpLovee， 


将 会 翻译 成 一 个 指令 序列 ， 将 起 始 地 址 为 x 的 27 个 存储 单元 的 内 容 复制 到 起 始 地 址 为 ?的 27 个 存储 
单元 中 。 

在 一 个 连续 存储 单元 块 中 存储 异 构 数 组 的 另 一 种 方法 就 是 ， 将 异 构 数 组 的 每 个 部 件 分 别 存 
放 在 不 同 的 位 置 ， 然 后 通过 指针 的 方式 将 它们 链接 在 一 起 。 更 准确 地 说 ， 如 果 这 个 数组 包含 有 3 
个 部 件 ， 那 么 就 在 存储 器 中 找到 一 个 位 置 ， 用 以 存放 3 个 指针 ， 每 个 指针 指向 一 个 部 件 〈 见 图 
8-ib)。 如 果 这 些 指针 存放 在 以 z 为 起 始 地 址 的 存储 块 中 ， 那么 通过 存放 在 地 址 为 x 的 指针 就 可 以 
找到 第 1 个 部 件 ， 通 过 存放 在 地 址 为 x+1 的 指针 就 可 以 找到 第 2 个 部 件 ， 以 此 类 推 ， 

这 种 存储 方式 在 有 些 场合 尤其 适用 ， 如 数组 部 件 的 大 小 是 动态 的 情况 。 举例 来 说 ， 通 过 利 
用 这 种 指针 系统 ， 只 需要 在 存储 器 中 找到 一 个 存储 区 来 存放 较 大 的 部 件 ， 然后 调整 相关 的 指针 ， 
令 其 指向 这 个 新 位 置 ， 这 样 就 可 以 增加 第 一 个 部 件 的 大 小 了 。 但 是 ， 如 采 数 组 是 存放 在 一 个 连 
续 的 存储 块 中 ， 那 么 不 得 不 修改 整个 数组 。 


8.3.2 ” 表 的 存储 
志 在 来 讨论 将 一 个 名 字 清 单 存放 在 计算 机 主 存 中 的 技术 。 一 种 方法 就 是 将 整个 表 存 入 具有 
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连续 地 址 的 一 整 块 存储 单元 中 。 假定 每 个 名 字 不 超过 8 个 字母 ， 我 们 可 以 把 这 个 大 的 整 块 存储 单 
元 分 成 一 组 子 块 ， 每 个 子 块 包含 有 8 个 存储 单元 。 每 个 子 块 中 放 入 一 个 用 ASCII 码 记录 的 名 字 ， 
一 个 单元 放 入 一 个 字母 。 如 果 一 个 名 字 不 足 填 满 分 配给 子 块 的 所 有 存储 单元 ， 只 需 用 空格 的 
ASCII 码 将 剩余 的 单元 填 满 就 行 。 利 用 这 种 方式 ， 存 放 一 个 10 个 名 字 的 列表 需要 一 个 有 80 个 连 
续 单 元 的 人 存储 块 。 

图 8-8 所 概括 的 就 是 这 种 存储 系统 。 其 重点 就 在 于 ， 整 个 表 都 存储 在 存储 器 的 一 个 大 块 中 ， 
其 连续 的 项 依次 存放 在 相 邻 的 存储 单元 中 。 将 这 样 的 一 种 组 织 称 为 邻接 甫 〈contiguous lists)。 


存储 单元 的 连续 块 
四 


加 
TIITTITITTIT 
-一 一 一 一 HUI 


第 一 个 名 字 第 一 个 名 字 最 后 一 个 名 
存放 于 此 存放 于 此 字 存 放 于 此 


图 8-8 ”名 单 作为 一 个 邻接 表 存 放 在 存储 器 中 


邻接 表 的 实现 


大 多 数 高 级 程序 设计 语言 都 提供 了 构建 和 操作 数组 的 原 语 ， 它 们 都 是 构建 和 操作 邻接 表 
的 方便 工具 .如 果 表 的 项 都 是 相同 的 基本 数据 类 型 ， 那 么 该 表 就 是 一 个 一 维 同 构 数 组 。 稍 微 
复杂 的 例子 是 文中 所 讨论 过 的 一 张 有 10 个 名 字 的 名 单 ,每 个 名 字 不 超过 8 个 字符 .这 种 情况 下 ， 
程序 员 可 以 构建 这 样 一 个 邻接 表 ， 即 为 一 个 10 行 8 列 的 二 维 字 符 数 组 ，。 该 表 可 以 呈现 为 图 8-6 
所 表示 的 结构 (假设 该 数组 以 行 主 序 进 行 存 放 。) 

许多 高 级 语言 都 含有 支持 这 种 表 实 现 的 特征 。 例 如 ， 假 设 将 上 面 所 提 到 的 二 维 字 符 数 组 
称 为 MembperList， 那 芭 依 据 传 统 的 表示 法 ， 表达 起 MermberList[3,5] 就 是 指 第 3 行 第 5 列 的 
那个 字符 。 有些 语 言 用 表达 式 MemberList [31 来 指 整 个 第 3 行 ， 也 就 是 表 中 的 第 3 个 项 。 


邻接 表 这 种 存储 结构 用 来 实现 静态 表 很 方便 。 但 就 动态 表 的 情况 而 言 ， 则 有 些 不 便 之 处 ， 
因为 名 字 的 添加 和 删除 都 会 导致 对 项 进行 不 断 的 移 位 操作 ， 这 样 就 比较 耗 时 。 最 坏 的 情况 下 ， 
项 的 增加 甚至 会 导致 这 样 一 个 问题 为 了 能 够 获得 足够 大 的 存储 单元 来 存放 这 个 扩展 过 的 表 ， 
必须 把 整个 表 移 到 一 个 新 的 位 站 。 

如 果 一 个 表 中 的 各 个 项 不 必 一 起 存放 在 连续 的 大 块 存 储 区 中 ， 而 可 以 各 自 存 放 在 不 同 的 仔 
储 区 域 ， 那 么 这 些 问 题 就 可 以 得 到 化 解 。 为 了 说 明 这 个 问题 ， 仍 然 考 虑 存放 名 单 的 例子 〈 每 个 
名 字 不 超过 8 个 字母 )。 这 次 ， 将 每 个 名 字 存 放 在 一 个 有 9 个 连续 存储 单元 的 块 中 。 前 面 8 个 存储 
单元 用 来 存放 名 字 本 身 ， 最 后 一 个 单元 用 作 指 针 ， 指 癌 表 中 的 下 一 个 名 字 。 遵 循 这 种 方法 ， 整 
个 表 可 以 分 散在 若干 个 较 小 的 由 指针 链接 起 来 的 9 单元 块 中 。 由 于 这 种 链接 系统 ， 就 将 这 梓 一 种 
数据 的 组 织 方式 称 为 链表 (linked list) 。 

为 了 记 下 链表 的 起 始点 ， 我 们 另外 再 设 一 个 指针 ， 用 来 存放 第 一 个 项 的 地 址 。 由 于 这 个 指 
针 是 指向 链表 的 起 始点 ， 或 者 叫 头 结 点 ， 所 以 将 此 指针 称 为 头 指针 〈head pointer )。 

为 了 标记 链表 的 结束 ， 我 们 使 用 了 NIL 指 针 〈NIL pointer) 〈 也 称 为 空 指针 (NULL pointer) )， 
这 只 是 放 在 最 后 一 项 的 指针 单元 中 的 一 个 特殊 的 位 模式 ， 用 来 表示 链表 中 不 会 再 有 别 的 项 。 例 如 ， 
如 果 约 定 不 会 在 0 地 址 存放 表 项 , 那么 0 值 就 不 会 成 为 合法 的 指针 值 , 因而 就 可 以 将 0 值 用 作 NIL 指针。 

最 后 的 链表 结构 如 图 8-9 所 示 ， 图 中 用 几 个 单个 的 矩形 表示 存放 链表 的 分 散 存 储 块 。 每 个 抑 
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形 都 标识 出 了 它们 的 组 成 元 素 。 指针 用 箭头 来 表 
示 ， 从 指针 本 身 引 向 指针 的 被 寻 地 址 。 如 果 要 电 
历 整个 链表 ， 就 需 按照 头 指针 找到 第 一 个 表 项 ， 
由 此 出 发 ， 按 照 项 中 所 存储 的 指针 指引 ， 一 个 接 
一 个 地 进行 遍历 ， 直 至 遇 到 NIL 指 针 。 

为 了 说 明 链表 相对 于 邻接 表 的 优势 , 这 里 考 
虑 删除 一 个 项 的 操作 。 在 邻接 表 中 ,删除 一 个 项 
就 会 产生 一 个 空缺 ， 这 就 意味 着 ， 被 删除 项 的 后 
续 项 必须 向 前 移动 来 保持 表 的 连续 。 然 而 ， 在 链 
表 的 情况 中 ， 删 除 一 个 项 只 需 改 变 一 个 指针 即 图 8-9 链表 的 结构 
可 。 也 就 是 说 ,将 原本 指向 被 删除 项 的 指针 修改 
成 指向 被 删除 项 后 面 的 那个 项 〈 见 图 8-10)。 这 样 一 来 ， 当 遍历 这 个 链表 时 ， 由 于 被 删除 项 已 不 
再 是 链 的 一 部 分 ， 因 而 就 会 被 忽略 。 


头 指 针 








删除 的 项 
名 字 指针 





让 时- 峡 寺 rr 





新 指针 
图 8-10 ”从 链表 中 删除 一 个 项 


在 链表 中 插入 一 个 新 项 的 工作 就 稍微 麻烦 一 点 。 首 先 要 找到 一 个 能 够 容纳 新 项 及 其 指针 的 
未 用 存储 块 ， 然 后 将 该 项 存 入 ， 并 将 该 项 的 指针 域 填 为 应 接 在 新 项 后 面 的 那个 项 的 地 址 。 最 后 ， 
修改 该 新 项 的 前 一 项 的 指针 ， 令 其 指向 新 项 〈 见 图 8-11)。 做 了 这 样 的 修改 后 ， 每 次 遍历 链表 的 
时 候 ， 就 能 在 合适 的 位 置 遍 历 到 新 项 。 


头 指 针 





图 8-11 向 链表 中 持 入 一 个 项 
8.3.3 ” 栈 和 队列 的 存储 
为 了 存储 栈 和 队列 ， 通 彰 采 用 一 种 类 似 于 邻接 表 的 存储 方式 。 就 栈 而 言 ， 所 预 留 的 存储 块 ， 
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其 大 小 要 足够 容纳 栈 的 伸缩 。( 确 定 这 个 存储 块 的 大 小 ,往往 很 关键 。 如 果 预 留 的 室 间 太 少 ， 则 
栈 可 能 会 超出 所 分 配 的 存储 空间 ， 然 而 ， 如 果 预 留 的 空间 太 多 ， 则 会 浪费 存储 空间 。) 将 这 个 存 
储 块 的 一 端 指定 为 栈 底 ， 压 入 栈 的 第 一 个 项 就 存储 在 这 里 。 于 是 ， 再 入 栈 的 项 就 放 在 其 上 一 个 
入 栈 的 项 的 旁边 ， 这 样 一 来 ， 栈 就 向 着 预 留 块 的 咏 一 凯 生 长 。 

注意 到 ， 在 项 入 栈 和 出 栈 时 ， 栈 项 的 位 置 会 在 预 留 的 存储 块 中 来 回 移 动 。 为 了 跟踪 这 个 位 
置 ， 就 用 一 个 外 加 的 存储 单元 来 存放 栈 顶 的 地 址 ， 这 个 存储 单元 称 为 栈 指针 〈stack pointer)。 
也 就 是 说 ， 栈 指针 是 指向 栈 顶 的 指针 。 

如 图 8-12 所 示 ， 整 个 模 系 统 是 这 征 工 作 栈 底 、 预 窗 的 存储 单元 块 
的 ， 为 了 向 栈 中 压 入 一 个 新 项 ， 首 先 要 调整 一 
栈 指针 ， 令 其 指向 正好 在 栈 顶 上 边 的 空闲 处 ， 









然后 将 新 项 存放 在 这 个 位 置 。 为 了 从 栈 顶 弹 本 
出 一 个 项 ， 先 读 取 栈 指针 指 回 的 那个 数据 ， | 一 
然后 调整 栈 指 针 ， 令 其 指向 栈 中 的 下 一 个 项 。 栈 指针 

队列 的 传统 实现 方法 类 似 于 栈 的 实现 方 人 


法 ， 也 是 在 内 存 中 预 留 一 块 连续 的 存储 单元 ， 

其 大 小 要 足够 容纳 预计 最 大 时 的 队列 。 然 而 ， 就 队列 这 种 情况 而 言 ， 需 要 在 队列 的 两 端 都 要 进 
行 操作 ， 所 以 不 能 像 栈 那 样 只 用 一 个 指针 ， 这 里 需 预 留 两 个 存储 单元 用 作 指 针 。 一 个 指针 称 为 
头 指针 (head pointer)， 用 来 跟踪 队列 的 头 ， 另 一 个 指针 称 为 尾 指 针 〈tail pointer)， 用 来 跟踪 队 
列 的 尾 。 当 队列 为 空 时 ， 这 两 个 指针 指向 同一 个 位 置 〈《 见 图 8-13)。 每 当 一 个 项 进入 队列 时 ， 职 
将 该 项 放 在 由 尾 指 针 指 向 的 位 置 ， 然 后 修改 尾 指 针 ， 令 其 指向 下 一 个 空闲 的 位 置 。 通 过 这 种 方 
式 ， 尾 指针 始终 指向 队列 尾部 的 第 一 个 空 亲 位。 如果 要 从 队列 中 删除 一 个 项 ， 则 先 谈 取 头 指 针 
指向 的 那个 项 ， 然 后 调整 头 指针 ， 令 其 指 四 队列 中 的 下 一 个 项 。 





(a) 空 队列 由 ) 插入 数据 项 A、B 和 C 之 后 


sn 头 指针 | 
尾 指针 | 


(中 删除 B 和 插入 E 之 后 
图 8-13 用 头 指针 和 尾 指 针 实 现 一 个 队列 。 注 意 ， 随 寿 项 的 插入 和 删除 ， 队 列 是 怎样 在 内 存 中 移动 





(c) 删除 A 和 插入 了 之 后 


= 二 
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至 此 ， 所 描述 的 这 种 存储 系统 存在 一 个 问题 ， 即 随 着 项 的 增加 和 删除 ， 队 列 会 像 冰 川 一样 
在 内 存 中 缓慢 移动 〈 见 图 8-13)。 这 样 一 来 ， 就 需要 一 种 机 制 ， 使 队列 保持 在 预 留 的 存储 块 中 。 
这 个 问题 的 解决 办 法 很 简单 ， 就 是 让 队列 自始至终 都 在 所 分 配 的 存储 块 中 移动 。 于 是 ， 当 队 尾 
到 达 队 列 的 未 端 时 ， 如 果 再 增加 一 个 项 ， 则 回 到 存储 块 的 起 始 端 进行 增加 操作 ， 这 时 的 起 始 问 
是 空闲 的 。 同 样 ， 当 存储 块 中 最 后 一 个 项 成 为 队 首 并 被 删除 时 ， 就 将 头 指针 调整 为 存储 块 的 起 
始 端 ， 这 时 ， 新 项 等 着 进入 队列 。 在 这 种 方式 下 ， 队 列 在 存储 块 内 按 环 状 依次 排列 ， 仿 佛 仓储 
块 的 尾部 被 连结 在 一 起 ， 形 成 了 一 个 循环 〈 如 图 8-14 所 示 )。 将 这 种 技术 所 实现 的 队列 称 为 循环 
队列 〈circular queue)。 


存储 块 中 的 
第 一 个 单元 


存储 块 中 的 
第 一 个 单元 













头 指 针 | | 存储 块 中 的 


最 后 一 小 单元 


头 指 针 | | 尾 指针 


原 指针 “是 时 


(b) 最 后 一 个 单元 与 第 一 个 单元 相 邻 的 概念 上 的 存储 


储存 据 中 的 
最 后 一 个 单元 
fa) 实际 存储 的 队列 
图 8-14 包含 字母 P 到 字母 V 的 循环 队列 


指针 的 一 个 问题 

就 像 使 用 流程 图 会 导致 杂乱 的 算法 设计 ( 见 第 5$ 章 )， 以 及 随意 使 用 goto 语 句 会 导致 鉴 脚 
的 程序 设计 ( 见 第 6 章 ) 一 样 ， 乱 用 指针 也 会 产生 不 必要 的 复杂 和 易 错 的 数据 结构 。 为 了 克服 
这 种 混乱 ， 许 多 程序 设计 语言 严格 限制 了 指针 的 灵活 性 ， 例 如 ，Java 语 言 不 允许 一 般 形 和 式 的 
指针 ， 而 只 允许 称 为 引用 的 一 种 受 限 形式 的 指针 。 其 区 别 在 于 ， 引 用 不 能 被 算 林 运算 修改 。 
举例 来 说 ， 如 果 Java 程 序 员 想 把 Next 引 用 前 移 至 邻接 表 中 的 下 一 个 项 ， 于 玄 特 会 用 等 价 于 下 
面 这 条 语 自 的 语 问 ; 

将 Next 重 新 定位 到 下 一 个 表 项 
而 C 程 序 员 则 会 用 等 价 于 下 面 这 条 语 铅 的 语 自 : 

将 Next 的 值 赋 给 Next+1 
注意 ，Java 语 身 能 更 好 地 反映 其 根本 目标 ， 而 有 全， 为 了 执行 这 条 Java 语 自 ， 另 一 个 表 项 必须 存在 。 
但 是 ， 如 果 Next 已 经 指向 了 表 中 的 最 后 一 项 ， 那 么 执行 这 条 C 语 自 ， 其 结果 将 会 造成 Next 指 向 
表 外 的 某 个 地 方 ， 这 对 于 C 编 程 新 手 ， 甚 至 是 经 验 丰富 的 老手 来 说 都 是 一 个 常见 的 错误 。 


8.3.4 ”二叉树 的 存储 
关于 树 的 存储 技术 ， 这 里 将 注意 力 限 于 讨论 二 又 树 。 我 们 说 过 ， 二 又 树 的 每 个 结 点 至 多 只 
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有 两 个 子 结 点 ， 它 通常 采用 类 似 于 链表 所 用 的 链接 结构 存放 在 存储 器 中 。 然 而 ， 二 又 树 的 每 个 
项 〈 或 称 为 结 点 ) 不 是 由 两 个 元 素 组 成 (数据 及 指向 下 一 个 结 点 的 指针 ),， 而 是 由 三 个 元 素 组 成 : 
(1) 数据 ，(2) 指向 该 结 点 的 第 一 个 子 结 点 的 指针 ，(3) 指向 该 结 点 的 第 二 个 子 绪 点 的 指针 。 
尽管 在 计算 机 中 ， 不 存在 左右 之 分 ， 但 这 里 为 了 方便 ， 就 将 第 一 个 指针 称 为 左 子 指针 (〈1left 
child pointer)， 而 另 一 个 指针 称 为 右 子 指 针 〈right child pointer)， 这 样 就 可 以 方便 地 在 纸 上 
画 出 树 的 图 形 。 所 以 ， 二 叉 树 的 每 个 结 点 可 由 一 个 简短 的 、 连 续 的 存储 块 来 表示 ， 其 格式 如 
图 8-15 扩 示 。 





”存储 数据 的 存储 单元 


图 8-15 二叉树 中 的 一 个 结 点 的 结构 


要 在 存储 器 中 存储 树 ， 首 先 要 找到 可 用 的 存储 单元 块 来 存放 树 结 点 ， 然 后 依据 所 要 求 的 树 
结构 ， 将 这 些 结 点 链接 起 来 。 每 个 指针 必须 设置 成 指向 其 相应 的 左右 子 结 后 ， 如 案 笛 的 未 修 方 
向 不 再 有 结 点 ， 则 将 相应 的 指针 赋值 为 NIL。( 这 也 就 说 明 ， 终 端 结 点 的 特征 就 是 其 两 个 方向 的 
指针 值 都 为 NILL。) 最 后 ， 留 出 一 个 专门 的 位 置 ， 称 为 根 指针 《root pointer)， 用 来 存放 根 结 点 的 
地 址 。 对 树 的 访问 就 是 从 根 指针 开始 的 。 

图 8-16 所 示 的 就 是 这 样 一 种 链接 存储 系统 的 例子 ， 在 该 图 中 ， 既 画 出 了 一 个 二 叉 树 的 概念 
结构 ， 又 展示 出 了 该 树 在 计算 机 存储 器 中 实际 的 存储 形式 。 可 以 看 出 ， 树 的 结 点 在 主 存 中 的 实 
际 组 织 形式 与 概念 上 的 组 织 形 式 有 很 大 的 不 同 。 然 而 ， 沿 着 根 指针 就 能 找到 根 结 反 ， 然 后 随 独 
相应 的 指针 ， 从 一 个 结 点 到 另 一 个 结 点 ， 由 上 至 下 地 通 历 树 。 


区 
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实际 的 存储 结构 
根 指针 
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国 天 
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图 8-16 二叉树 的 概念 组 织 和 使 用 链接 系统 实现 的 实际 组 织 形 式 


对 于 二 叉 树 的 存储 ， 除 了 用 链接 结构 外 ， 还 可 以 用 单个 的 、 连 续 存储 单元 块 来 存放 整个 树 。 
利用 这 种 方法 ， 把 树 的 根 结 点 存放 在 这 个 存储 块 的 第 1 个 单元 。( 为 了 倘 单 起 见 ， 假 设 树 的 每 个 
结 点 只 需要 一 个 存储 单元 。) 然后 ， 把 根 的 左 子 存放 在 第 2 个 单元 ， 根 的 右 子 存放 在 第 3 个 单元 。 
就 一 般 情况 而 言 ， 单 元 as 中 结 点 的 左 、 布 子 结 点 分 别 存 放 在 单元 2 和 2m+l 中 。 在 仓 人 块 中 ， 没 有 
被 树 用 到 的 单元 就 用 一 个 特别 的 位 模式 来 标识 ,表示 这 个 位 置 没 有 数据 。 利 用 这 种 技术 ,图 8-16 
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中 万 示 的 树 可 以 像 图 8-17 所 示 那 样 进行 存储 。 注 意 到 ， 这 种 存储 系统 实际 上 是 由 上 至 下 地 将 树 
中 各 层 的 结 点 作为 存储 段 来 存放 ， 一 层 接 着 一 层 。 也 就 是 说 ， 仓储 块 中 的 第 1 个 项 是 根 结 点 ， 接 
下 来 是 根 结 点 的 子 结 点 ， 然 后 是 孙子 结 点 ， 以 此 类 推 。 


Rong 


瑟 


实际 的 存储 结构 
1 到 | 愉 5 6 7 
和 
根 结 点 


在 树 第 2 屋 在 树 第 3 层 
中 的 结 点 中 的 结 点 


图 8-17 ”指针 存储 的 一 棵 树 


与 前 面 所 描述 的 链接 结构 不 同 ， 这 种 存储 系统 在 查找 某 个 结 点 的 父 结 点 或 兄弟 结 点 方面 就 
显得 更 为 有 效 。 一 个 结 点 的 父 结 点 的 位 置 可 以 这 样 确定 ， 即将 该 结 点 的 位 置 除 2， 然 后 丢掉 余数 
印 得 〈 如 位 置 为 7 的 结 点 ， 其 父 结 点 的 位 置 为 3)。 一 个 结 点 的 兄弟 结 点 的 位 置 可 以 这 样 确定 ; 如 
朱 该 结 点 的 位 置 为 偶数 ， 则 其 兄弟 结 点 的 位 置 加 上 1 即 得 ; 如 果 该 结 点 的 位 置 为 奇数 ， 则 其 兄弟 
结 点 的 位 置 减 去 1 即 得 。 例 如 ， 位 置 为 4 的 结 点 ， 其 兄弟 结 点 的 位 置 为 5， 而 位 置 为 3 的 结 点 ， 其 
匈 加 结 所 的 位 置 为 2。 而 且 ， 当 二 叉 树 接近 平衡 (也 就 是 说 ， 根 结 点 下 的 两 个 子 树 具 有 同样 的 深 
度 ) 和 完全 〈 也 就 说 ， 该 树 没 有 瘦 、 长 的 分 支 ) 的 情况 下 ， 这 种 存储 系统 对 存储 空间 的 利用 更 
为 有 效 。 不 过 ， 对 于 不 具备 这 些 特征 的 树 ， 该 系统 的 效率 就 会 很 低 ， 如 图 8-18 所 示 。 








概念 树 
实际 的 存储 结构 

ee 
根 第 2 层 第 3 层 第 4 尼 


图 8-18 一 个 黎 朴 不 均衡 树 的 概念 形式 以 及 不 用 指针 的 存储 方式 
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8.3.5 ”数据 结构 的 操作 


我 们 已 经 看 到 ， 数 据 结 构 在 计算 机 存储 器 中 的 实际 存储 方式 与 用 户 想 象 的 概念 结构 是 不 同 
的 。 二 维 同 构 数组 实际 上 并 不 是 存放 在 一 个 二 维 的 算 形 人 存储 块 中 ， 表 或 树 实际 上 可 能 由 分 散在 
较 大 范围 的 存储 区 域内 的 小 片段 组 成 。 

所 以 ， 为 了 让 用 户 将 数据 结构 作为 一 种 抽象 工具 来 访问 ， 必 须 对 用 户 屏 项 实际 存储 系统 的 
复杂 性 。 这 就 意味 着 ， 用 户 所 给 出 的 指令 《按照 抽象 工具 的 方式 规定 的 ) 必须 翻译 成 对 实际 存 
储 系 统 操作 的 步骤 。 在 同 构 数 组 的 情况 下 ， 我 们 已 经 看 和 到， 翻译 程序 如 何 利用 地 址 多 项 式 将 行 、 
列 下 标 转化 成 存储 单元 地 址 。 具 体 来 说 ， 语 人 句 


Sales[3,4] <* 盖 5; 


在 程序 员 编写 时 ， 只 将 其 作为 抽象 的 同 构 数组 来 考虑 ， 而 我 们 已 经 知道 ， 如 何 将 这 条 语句 转化 
为 完成 对 主 存 进行 正确 修改 的 操作 步骤 。 同 样 地 ， 我 们 也 知道 ， 涉 及 抽象 异 构 数 组 的 语句 


EmplLovee. Age 二 22) 


如 何 依据 该 数组 的 实际 存储 情况 将 其 翻译 成 合适 的 操作 。 

在 表 、 栈 、 队 列 以 及 树 这 些 情况 中 ， 根 据 抽 象 结 构 所 定义 的 指令 通常 是 利用 过 程 将 其 转化 
为 相应 的 操作 的 ， 而 这 些 过 程 为 用 户 屏蔽 底层 存储 系统 的 细节 的 同时 ， 还 完成 其 预期 的 任务 。 
例如 ， 如 果 insert 过 程 是 用 来 在 链表 中 揪 入 新 项 ， 那 么 只 要 执行 如 下 的 一 个 过 程 调 用 ， 就 可 
以 将 本 W. Brown 加 入 Physics 208 班 的 学 生 和 名 单 中 : 


1ImSert (” Bown， 可 .网 ,"，Ehyszcs208) 
可 以 注意 到 ， 这 个 过 程 调 用 守 全 是 依据 抽象 结构 声明 的 ， 通 过 这 种 方式 ， 可 以 把 表 的 实际 执行 
过 程 隐藏 起 来 。 


图 8-19 所 示 的 是 一 个 更 为 详细 的 例子 ， 名 为 printList 过 程 被 用 来 打印 名 字 链 表 。 在 这 个 
过 程 中 ， 假 设 称 为 头 指 针 的 指针 指向 了 链表 中 的 第 一 个 项 ， 而 每 个 项 都 由 两 个 元 素 组 成 : 名 字 
和 指 问 下 一 个 项 的 指针 。 这 个 过 程 一 旦 编写 好 ， 就 可 以 作为 一 个 抽象 工具 用 来 打印 链表 ， 而 无 
需 关 心 打 印 链表 所 需 的 实际 步骤 。 例 如 ， 要 获得 一 份 Economic 301 班 打印 的 学 生 名 单 ， 用 户 只 
需 执 行 下 面 的 过 程 调用 : 

PrintList(〔〈(Economics301C1assLiest ) 


就 能 得 到 预期 结果 。 而 且 ， 如 果 以 后 我 们 想 改 变 表 的 实际 存储 方式 ， 那 么 就 只 需 改 变 过 程 
printList 的 内 部 操作 ， 而 对 用 户 而 言 ， 仍 然 可 以 继续 使 用 以 前 的 同一 个 过 程 调用 来 完成 打印 
操作 。 


Procedure PrintList 《List> 
Currentpointer 一 List 的 头 指 针 
While 《CurrentPointer 不 是 NILy do 


《打印 CurrentpPointer 指 向 的 项 中 的 名 字 ， 
观察 CurrentPointer 指 向 的 List 项 的 指针 单元 中 的 值 
并 重新 将 CurrentpPointer 赋 值 为 那个 值 ) 





图 8-19 ”一 个 打印 链表 的 过 程 
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问题 与 练习 
1 请 画 出 下 面 的 数组 是 如 何以 行 主 序 的 方式 在 主 存 中 存放 的 。 
全 


2. 如 果 一 个 二 维 数组 是 以 列 主 序 的 方式 ， 而 不 是 行 主 序 的 方式 存 竺 的 ， 那 么 请 给 出 一 个 公式 ， 用 来 查 
找 该 二 维 数组 中 的 第 ; 行 第 / 列 的 元 素 。 

3. 企 C、C++、Java 以 及 C# 这 些 编程 语言 中 , 数组 的 F 标 是 从 0 开始 的 , 而 不 是 从 1 开始 。 所 以 ， 才 组 六 六 ra 
的 第 1 行 第 4 列 的 项 可 由 Array[0] [3] 表 示 。 了 这 种 情况 下 ， 翻 详 程序 将 使 用 什么 样 的 地 址 和 多项式， 把 
ArIay[ilr]] 这 样 的 引用 格式 转化 为 存储 器 地 址 呢 ? 

. 什么 条 件 指 明 链表 为 空 ? 

.修改 图 8-19 所 示 的 过 程 ， 要 求 一 旦 打 印 出 某 个 指定 的 名 字 就 停止 打印 ， 

， 节 于 本 节 所 提 到 的 在 -个 连续 的 存储 单元 块 中 实现 本 的 技术 ，1 [各 条 件 指 明 栈 为 室 ? 

. 博 说 明 ， 在 高 级 语言 中 ， 怎 样 用 一 维 数组 来 实现 个 栈 ? 

- 划 宁 一 个 队列 是 运用 本 节 所 描述 的 循环 方式 实现 的 ， 那 各 当 队 列 为 室 时 ， 头 指针 和 尾 指针 的 关系 如 
何 ? 队列 满 时 ， 美 系 又 如 何 ? 旦 么 样 来 检测 队列 是 满 的 还 是 空 的 ? 
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9. 恢 据 本 节 所 讲 的 ， 当下 面 的 一 棵 树 采 用 的 是 左 子 指针 和 右 子 指针 的 方式 存储 时 ， 试 画 出 其 在 存储 器 
中 存放 的 情况 。 再 者 ， 利用 本 节 所 讲 的 树 的 另 一 种 存储 方式 ， 再 画 出 另 一 幅 图 ， 大 示 利用 连续 存储 块 
仓 放 时 的 情况 。 
和 
小 \ 
并 眉 
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人 TFT 计生- 各 下 下 EE 本 用 厅 于 表征 基业 让 和 本 -Fe 析 本 1 本 
别 
RE 一 


志 在 考虑 一 个 按 字母 顺序 排列 名 单 的 存储 方案 。 假设 对 这 个 表 进 行 如 下 操作 ， 


查找 【search) 一 个 项 ， 
按 字母 顺序 打印 〈print) 和 名单， 
插入 【〔insert) 一 个 新 项 


扒 目 标 是 开发 一 个 存储 系统 以 及 实现 这 些 操作 的 一 组 过 程 , 这 样 就 实现 了 一 个 完整 的 抽象 工具 ， 
站 先 考 虑 存储 这 个 表 的 几 种 可 选 的 方法 。 如 果 按照 链表 方式 来 存储 ， 就 需要 对 表 以 品行 的 
方式 进行 搜索 ， 在 第 5 章 中 就 讨论 过 这 样 -一 个 过 程 ， 如 采 表 很 长 ， 那 么 这 个 处 理 过 程 的 效率 就 非 
各 低 。 所 以 要 寻找 另外 一 种 实现 方法 ， 使 得 搜索 过 程 能 够 利用 到 二 分 搜索 算法 〔 见 5.5 节 )。 为 
了 利用 这 种 算法 ， 必 须 能 从 所 采用 的 存储 系统 中 成 功 地 找到 这 个 表 的 较 小 部 分 里 的 中 间 项 、 其 
于 浴 从 法 就 是 将 表 用 二 又 树 的 形式 进行 存储 。 也 就 是 说 ， 首 先 将 表 的 中 间 项 作为 根 结 点 ， 然 后 
也 表 余 下 部 分 的 头 一 半 的 中 间 项 作为 根 结 点 的 左 子 结 点 ， 把 表 余下 部 分 的 后 一 半 的 中 间 项 作 闷 
殷 结 所 的 右 子 结 点 。 接 下 来 ， 将 表 的 剩余 部 分 〔 除 去 根 结 点 ) 的 每 四 分 之 一 部 分 的 中 间 项 再 作 
[395| 为 很 结 点 的 子 结 点 的 子 结 点 ， 依 次 类 推 。 例 如 ， 图 8-20 所 示 的 树 就 表示 了 包含 有 A、B_C_D， 
PE、F、G、H、TI、 相 玉 、 工 及 M 的 一 个 字母 表 。( 我 们 约定 ， 当 所 讨论 的 表 的 一 部 分 有 偶数 个 项 
时 ， 则 取 中 间 两 项 里 的 大 者 为 中 间 项 。) 


8.4 ”一 个 简短 业 例 的 研究 
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图 8-20 ”字母 A 到 M 排 列 成 一 个 有 序 树 


为 了 搜索 以 这 种 方式 存储 的 表 ， 先 将 目标 值 与 根 结 点 的 值 进行 比较 ， 如 果 两 者 相等 ， 则 搜 
索 成 功 。 如 果 它 们 不 相等 ， 则 依据 目标 值 是 小 于 或 是 大 于 根 结 点 的 值 ， 分 别 转移 至 根 的 左 子 结 
氮 或 者 右 子 结 点 。 这 样 我 们 就 可 以 发 现 ， 继 续 搜 索 的 工作 只 需 在 表 的 一 半 中 进行 。 这 样 的 一 种 
比较 然后 转移 至 子 结 点 的 过 程 一 直 继 续 下 去 ， 直 至 找到 目标 值 〔( 说 明 搜索 工作 成 功 了 ) 或 者 最 
后 遇 到 了 NIL 指 针 却 还 没有 搜索 到 目标 值 《说明 搜 索 工 作 失 败 了 ) 为 止 。 

图 8-21 表 示 的 是 ， 在 链接 的 树 结构 情况 下 ， 如 何 来 表示 这 样 一 种 搜索 过 程 。 注 意 ， 图 5-14 
所 表示 的 就 是 二 分 搜索 算法 的 原始 描述 ， 而 这 里 的 这 个 过 程 仅仅 为 该 算法 的 一 个 细 化 而 已 ， 其 
区 别 从 很 大 程度 上 讲 是 表面 上 的 。 原 先 所 描述 的 算法 是 对 表 的 小 片段 逐步 进行 搜索 ， 而 这 里 所 
拉 述 的 算法 是 对 较 小 的 子 树 进行 逐步 搜索 ( 见 图 8-22 )。 


procedure Search (Tree，TargetValre ) 


上 《Tree 根子 指针 = NIL) 


then 
《声明 搜索 先 败 ) 


忆 15e 

《执行 与 下 面 的 情况 相关 联 的 指令 块 ) 

case 1:TargetValue= 根 结 点 的 值 
《报告 搜索 成 功 ) 

case 2:TargetValue< 根 结 点 的 值 
《应 用 Search 过 程 看 TargetValue 是 否 在 根 的 左 子 指针 标识 
的 子 树 中 ， 并 报告 搜索 的 结果 》) 

case 3:TargetValue> 根 结 点 的 值 
《应 用 $earch 过 程 看 TargetValue 是 否 在 根 的 右 子 指针 标识 

的 子 树 中 ， 并 报告 搜索 的 结果 ) 


图 8-21 ”二 分 搜索 用 于 链接 二 叉 树 实现 的 表 








图 8-22 利用 图 8-20 中 的 过 程 搜索 字母 J 所 涉及 的 相继 变 小 的 树 
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你 也 许 会 这 样 认为 ， 当 把 “ 表 ” 存 储 为 一 个 二 叉 权 时， 按照 字 母 顺序 对 这 个 表 进 行 打印 的 

过 程 将 会 很 困难 。 然 而 ， 为 了 能 按照 字母 顺序 打印 出 这 个 表 ， 这 里 只 需要 先 按 字母 顺序 打印 出 

稀 子 树 ， 然 后 打印 出 根 结 点 ， 接 下 来 再 技 字 母 打印 出 右 子 树 即 可 〈 见 图 8-23)。 因 为 ， 左 子 树 所 

B96| 包含 的 元 素 都 小 于 根 结 点 的 值 ， 而 右 子 树 所 包含 的 元 素 都 大 于 根 结 点 的 值 。 到 目前 为 止 ， 该 算 


法 的 逻辑 框架 如 下 表示 ; 
if ( 树 非 空 ) 
then (按照 字母 顺序 打印 左 子 树 ; 
打印 根 结 点 ; 
按照 宇 母 顺序 打印 右 子 树 ) 
ee 
口 H 局: 
。 。 
2 
CC | 
1. 接 字 母 序 打 “2. 打印 根 3. 按 字母 序 打 
印 左 分 支 结 点 印 右 分 支 
A， B， CC， 0 本 H， 1 y 


图 8-23 ” 技 字 母 顺序 打印 出 一 个 查找 树 


这 个 框架 中 包含 按照 字母 顺序 打印 左 子 树 和 右 子 树 这 两 项 任务 ， 这 两 项 任务 本 质 上 是 原始 
打印 任务 的 缩小 版 本 。 也 就 是 说 ， 打 印 一 个 树 涉及 打印 子 树 的 任务 ， 这 就 使 人 想到 运用 递归 方 
法 来 解决 树 的 打印 问题 。 


随 着 动态 数据 结构 的 增 大 或 缩小 ， 存 储 空间 也 被 占用 或 释放 回收 不 用 的 存储 室 间 以 备 
将 来 使 有 用， 这样 一 个 过 程 称 为 垃圾 回收 (garbage collection )。 许 多 场合 都 用 到 了 垃圾 回收 机 
币 | 。 探 作 系统 里 的 存储 管理 程序 在 分 配 和 回收 存储 空间 时 必须 完成 垃圾 回收 工作 区 性 营 理 
程序 在 计算 机 海量 存 鱼 器 上 进行 文件 的 存放 和 删除 操作 时 ， 也 要 完成 坛 报 回收 工作 。 此 外 ， 
在 分 派 程序 控制 下 运行 的 任何 进程 ， 在 给 其 分 配 的 存储 空间 中 也 需要 完成 垃圾 回收 工作 . 

垃 缓 回收 涉及 一 些 难以 捉摸 的 问题 。 在 链接 结构 的 情况 下 ， 每 次 当 一 个 指向 数据 项 的 指 
针 改 变 时 ， 垃 航 回收 程序 必须 决定 是 否 要 回收 指针 原先 指向 的 那个 存储 空间 - 在 涉及 有 多 品 
径 指针 交叉 的 数据 结构 中 , 这 种 问题 就 尤为 复杂 。 不 准确 的 垃圾 回收 例 程 会 导致 数据 的 于 失 - 
或 者 是 存储 空间 的 利用 率 较 低 。 例 如 ， 如 采 垃 圾 回收 操作 不 能 成 功 地 回收 存储 空间 : 那么 有 
将 的 个 储 空间 就 会 越 来 越 小 ， 这 种 现象 称 为 内 存 泄 露 ( memory leak )， 

依据 这 条 线索 ， 可 以 把 原先 的 设想 扩展 为 打 印 二 又 树 的 一 个 完整 的 擅 代 码 过 程 ， 如 图 8-24 


所 示 。 这 里 ， 将 该 例 程 命名 为 PrintTmree， 然后 再 请 求 调用 PrintTree 服 务 来 打印 左 子 树 和 右 
子 树 。 可 以 注意 到 ， 因为 连续 的 递归 过 程 中 ， 每 次 递归 所 操作 的 树 都 要 比 启动 递归 的 那个 树 要 
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小 ， 因 而 ， 递 归 过 程 的 结束 条 件 〈 遇 到 一 个 空子 树 ) 肯定 会 达到 。 
Procedure PrintTree 【Tree ) 


证 【Tree 非 空 ) 


then 【〈 亲 以 Tree 中 左 分 支出 现 的 树 应 用 printTree 过 程 ， 打 印 
Tree 的 根 结 点 ;对 以 Tree 中 左 分 支出 现 的 树 应 用 
PrintTree 过 程 ) 





图 8-24 ”用 于 打印 二 叉 树 中 的 数据 的 过 程 


在 树 中 ， 插 入 一 个 新 项 的 工作 比 起 初 看 起 来 的 也 要 容易 。 直 觉 也 许 会 认为 ， 插 入 新 项 只 需 
先 将 树 切 开 ， 为 新 项 留 出 空间 ， 但 实际 上 ， 所 添加 的 结 点 不 论 其 值 如 何 ， 只 要 作为 一 个 新 的 叶 
子 结 反 就 可 以 将 其 插入 到 树 中 。 为 了 给 新 项 找到 合适 的 位 置 ， 要 沿 着 如 果 为 查找 该 项 而 遵循 的 
那 条 路 径 往 下 走 。 由 于 该 项 并 不 在 树 中 ， 所 以 我 们 将 会 查找 到 一 个 NIL 指 针 。 这 个 位 置 就 是 要 
仓 放 新 结 点 的 合适 位 置 《 见 图 8-25)。 事 实 上 ， 找 到 的 这 个 位 置 正 是 寻找 新 项 所 到 达 的 地 点 。 





吉 了 
(al 为 这 个 新 项 寻找 一 个 空位 置 
HH 
1 Se 
人 有 
B 避 长 P 
[AN 
可 下 
人 b) 这 就 是 这 个 新 项 所 应 存放 的 位 置 


图 8-25 ”把 项 M 揪 入 到 以 树 结构 存储 的 表 B、E、G、H、J、 久 、N、P 
在 链接 树 结 构 的 情况 中 ， 这 个 处 理 过 程 的 程序 如 图 8-26 所 示 。 这 里 ， 首先 对 树 进 行 搜 索 ， 


。 找到 要 插入 的 值 〈 称 为 Newvalue)， 然 后 再 把 包含 有 Newvalue 的 一 个 新 叶子 结 点 放 到 相应 的 位 ， 


置 。 注 意 ， 如 果 在 搜索 过 程 中 发 现 要 插入 的 项 已 经 在 树 中 ， 则 不 必 进 行 插 入 操作 。 

可 以 得 出 这 样 一 个 结论 : 包含 了 链接 二 叉 树 结构 以 及 用 于 查找 、 打 印 、 插 入 操作 的 这 些 过 
程 的 软件 包 提供 了 一 个 完整 的 包 ， 并 且 可 以 作为 我 们 假想 应 用 的 一 个 抽象 工具 。 事 实 上 ， 如 果 
实现 得 恰当 , 可 以 使 用 这 个 软件 包 而 无 需 关 心底 层 的 实际 存储 结构 。 通 过 利用 软件 包 中 的 过 程 ， 
用 户 可 以 想象 出 按 字 母 顺序 存放 的 名 单 表 。 而 事实 上 ， 这 个 表 的 项 都 分 散在 不 同 的 存储 单元 块 


397 
398 


下 
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procedure insert (Tree,NewValue) 





ff (Tree 的 根 指针 =MNIU 
(设置 根 指针 指向 包含 Newvalue 的 新 叶子 结 点 ) 
else (执行 与 相应 情况 对 应 的 指令 块 ) 
case 1:NewValue= 根 结 点 的 值 
(什么 也 不 做 ) 
case 2:NewValue< 根 结 点 的 值 
(if 根 结 点 的 左 子 指针 = NIU) 
then (设置 该 指针 指向 包 合 Mewwvalue 的 新 时 
子 结 点 ) 
else (应用 Insert 过 程 来 揪 入 NewValue 到 左 子 
指针 标识 的 子 树 中 ) 
case 3:NewValue> 根 结 点 的 值 
(if 根 结 点 的 右 子 指针 =NIU) 
then ( 奶 置 该 指针 指向 包 依 Newvalue 的 新 叶 
子 结 点 ) 
else (应 用 Insert 过 程 来 插入 Newvalue 到 右 子 
指针 标识 的 子 树 中 ) 




















) end 于 






图 8-26 ”在 以 二 叉 树 存储 的 表 中 插入 新 项 的 过 程 


问题 与 练习 

1 表 一 个 二 又 树 ， 要 求 该 树 可 以 用 来 存放 表 R、S、T、U、V、W、X、Y 和 Z， 以 备 将 来 搜索 之 用 。 

2. 闹 要 说 明 ， 图 8-21 中 的 二 分 搜索 算法 在 应 用 到 图 8-20 中 的 树 时 ， 为 查找 项 J 所 经 历 的 路 径 。 查 找 项 P 时 
的 路 径 又 是 什么 ? 

”图 一 个 图 ,用 来 表示 图 8-24 中 打印 树 的 递归 算法 用 在 图 8-20 所 示 的 有 序 树 中 打印 K 结 点 时 的 活动 状况 。 

4, 一 个 树 结构 ， 其 每 个 结 点 有 26 个 子 结 直 。 斌 描述 这 样 一 个 结构 是 如 何 对 英语 中 的 拼写 正确 的 词汇 进 
行 编码 的 。 


本 生生 可 本 站 站 让- 全 直 交 让 二 ED 和 而 风 ip 末 站 和 机 才 二 下 二 0 二 


一 CT 


在 第 6 章 中 ,我们 已 经 介绍 过 数据 类 型 的 概念 ， 并 讨论 了 如 整 型 、 实 型 、 字符 型 及 布尔 型 等 
这 桩 的 一 些 基本 数据 类 型 。 大 多 数 编程 语言 都 提供 这 些 数据 类 型 ， 并 作为 基本 数据 类 型 ， 在 本 
节 中 ， 我 们 讨论 这 样 的 一 种 方式 ， 即 程序 员 定 制 自己 的 数据 类 型 ， 以 便 能 更 好 地 符合 某 个 具体 
应 用 的 需要 。 


8.5.1 用 户 自 定义 数据 类 型 


如 果 除 了 编程 语言 中 提供 的 那些 基本 数据 类 型 外 ， 还 有 其 他 数据 类 型 可 以 用 ， 那 么 ， 对 于 
表达 一 个 算法 来 说 ， 通 常 就 比较 简单 了 。 基 于 这 种 原因 ， 现代 的 许多 编程 语言 都 允许 程序 员 利 
用 茎 本 数据 类 型 作为 构件 块 ， 来 定义 一 些 附 加 的 数据 类 型 。 这 些 “ 自 制 ” 的 数据 类 型 的 最 基本 
的 例子 称 为 用 户 自 定义 数据 类 型 〈user-defined data types)， 有 本质 上 就 是 几 个 基本 数据 类 型 组 
合 而 成 的 具有 同一 名 字 的 聚合 体 。 

为 了 对 此 进行 解释 ， 这 里 假设 要 开发 一 个 涉及 许多 变量 的 程序 ， 而 每 个 变量 都 有 相同 的 异 
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构 数组 结构 ， 该 结构 中 包含 有 名 字 、 年 龄 以 及 技能 级 别 。 一 种 方法 是 将 每 个 变量 分 别 定 义 成 异 
构 数 组 〈 见 6.2 节 )。 然 而 ， 更 好 的 办 法 是 将 这 个 异 构 结 构 数 组 定义 成 一 种 新 的 〈 用 户 自 定 义 的 ) 
数据 类 型 ， 然 后 就 把 这 种 新 的 数据 类 型 作为 一 种 基本 类 型 来 使 用 。 

为 了 实现 上 述 思想 ， 这 里 我 们 采用 如 下 的 伪 代 码 语句 的 形式 来 定义 一 个 称 为 EmployeeType 
的 新 类 型 。 


define type EmployeeType to be 
{char Name[25]; 

int Age， 

real SkillIRatinmeg， 

} 


这 个 开 构 结构 中 包含 的 组 成 元 素 有 Name (字符 型 )、Age 〈 整 型 ) 以 及 SkillRating〈 实 型 )。 
这 样 一 来 ， 就 可 以 采用 与 基本 数据 类 型 相同 的 声明 变量 的 方式 ， 用 这 个 新 的 数据 类 型 来 声明 态 
和 量 。 也 就 是 说 ， 大 多 数 编程 语言 都 用 语 名 


int X; 
来 声明 变量 x 为 整数 。 同 样 ,变量 Employee1 也 可 以 采用 如 下 的 语句 来 声明 为 EmployeeType 类 型 ， 
EmployeeTYype Employee1， 


字 、 年 龄 和 技能 级 别 。 存 储 块 中 的 各 个 项 可 以 通过 诸如 Employee1 .Name 和 Employee1.Age 这 样 
的 方式 来 引用 。 所 以 ， 语 名 


Employee1.Age 二 26 
会 被 用 来 为 Employee1 块 中 的 Age 元 素 赋值 ， 其 赋 的 值 为 25。 而 且 ， 语 名 
EmployeeType DistManager S$alesRep1， SalesRep2， 


可 以 用 来 将 3 个 变量 DistManager， sajesRep1 和 5$alesRep2 声 明 为 EmployeeType 类 型 ， 正 如 如 下 
形式 的 语句 ; 


real S|leeve，Waist， Neck: 


通常 被 用 作 将 变量 $leeve、Waist、 Neck 声 明 为 基本 的 real 类 型 。 

分 清 用 户 自 定义 数据 类 型 与 这 个 类 型 的 一 个 实际 项 之 间 的 区 别 非 常 重要 。 后 者 称 作为 数据 
基 型 的 一 个 实例 〈instance)。 一 个 用 户 自 定义 的 数据 类 型 ， 其 本 质 上 是 一 个 用 来 构建 数据 类 型 
实例 的 模板 。 该 模板 描述 了 这 种 类 型 的 所 有 实例 所 具有 的 属性 ， 但 是 它 本 身 并 非 创 建 了 这 种 类 
型 的 一 个 实例 〈 这 就 好 比 ， 饼 干 模 是 做 饼干 的 模板 ， 但 其 本 身 不 是 饼干 )。 在 上 面 的 例子 中 ， 用 
己 目 定义 的 数据 类 型 EmployeeType 被 用 来 构建 了 三 个 实例 ， 即 DistManager、 SalesRep1 和 
SalesRep2 。 


8.5.2 ”抽象 数据 类 型 


从 芝 用户 自 定 义 数据 类 型 的 概念 比较 有 用 ， 但 它 还 不 足以 创建 完整 意义 上 的 新 数据 类 型 . 
一 个 完整 的 数据 类 型 包含 两 部 分 : 〈1) 一 个 预先 确定 的 存储 系统 〈 如 整 型 情况 中 的 二 进 制 补 三 
系统 和 实 型 情况 中 的 浮 点 系统 )，(2) 一 组 预先 定义 的 操作 〈 如 加 和 减 )。 具 体 来 说 ， 程 序 设计 
语言 中 的 基本 数据 类 型 要 与 其 基本 的 操作 相 联系 。 如 果 程 序 员 将 一 个 变量 声明 为 一 个 基本 类 型 ， 
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则 无 需 进 一 步 的 定义 ， 程 序 员 就 可 以 对 该 变量 进行 基本 的 操作 。 

然而 ， 传 统 的 用 户 自 定义 数据 类 型 仅仅 是 允许 程序 员 定 义 了 新 的 存储 系统 ， 而 没有 提 傣 对 
具有 这 些 结构 的 数据 进行 处 理 的 操作 。 为 了 对 此 进行 说 明 ， 这 里 假设 要 在 一 个 程序 中 创建 和 使 
用 几 个 整数 栈 。 其 方法 可 以 是 ， 将 每 个 栈 实现 成 一 个 有 20 个 整数 值 的 同 构 数 组 。 栈 帮 中 的 项 可 
以 放 在 〈 压 入 ) 数组 第 一 个 位 置 ， 栈 的 其 他 项 将 相继 放 在 《上 压 入) 数组 换 位 项 处 〈 见 8.3 世 的 
问题 与 练习 7)。 再 用 一 个 整 型 变量 作为 栈 指针 ， 用 来 存放 数组 项 的 下 标 ， 而 下 一 个 栈 项 将 会 被 
压 入 到 该 数组 中 。 因 此 ， 每 个 栈 都 由 一 个 存放 栈 本 吴 的 同 构 数组 和 一 个 起 者 栈 指针 作用 的 整数 
组 成 。 

为 了 实现 这 个 构想 ， 首 先 要 用 下 列 形式 的 语句 来 建立 一 个 称 为 StackType 的 用 户 上 自 定 义 关 
型 ; 

Jefine type stackTYpe to be 

fint StackEntries[20]; 

nt StackPointer = 日 ; 
(可 以 注意 到 ， 仿 效 如 C、C++、C# 及 Java 这 些 语 言 ， 就 可 以 假设 数组 StackType 的 下 标 也 是 从 0 
到 19， 这 样 StackPointer 指 针 的 初始 值 就 为 0。) 做 了 这 个 声明 之 后 ， 我 们 就 可 以 通过 如 下 语句 来 
声明 称 为 StackOne、S$tackTwo 和 StackThree 的 栈 ; 


StackTYpe StackOne， StackTwo ， StackThree: 


此 时 ， 变 量 StackOne、SstackTwo 和 StackThree 中 的 每 一 个 都 可 以 引用 一 个 单独 的 存储 单元 块 ， 
用 以 实现 各 自 的 栈 。 

但 是 ， 如 果 现 在 要 把 2$ 这 个 值 压 入 到 StackOne， 那 么 该 怎么 办 ? 当然 ， 我 们 希望 能 屏蔽 掉 
底层 堆栈 实现 的 数组 结构 的 细节 ， 而 仅仅 将 栈 作 为 一 种 抽象 工具 来 使 用 ， 即 可 能 会 用 类 似 于 


Push(25，StacKOme) 


这 样 的 一 个 过 程 调用 。 但 是 ， 如 果 不 定 义 一 个 称 为 push 的 相应 过 程 ， 那 么 这 样 的 一 条 语 铅 就 不 
可 用 。 要 完成 对 StackType 类 型 的 变量 的 操作 还 包括 从 栈 中 弹出 项 、 检 查 栈 是 否 为 宅 以 及 检查 栈 
是 否 已 满 ， 而 这 所 有 的 操作 都 要 求 再 定义 相应 的 过 程 。 简 而 言 之 ， 我 们 定义 的 StackType 数 据 类 
型 并 不 包括 与 之 关联 的 所 有 特性 。 
对 此 问题 的 解决 办 法 是 ， 对 定义 语句 define type 进 行 扩 展 ， 使 其 既 包 括 数 据 的 描述 ， 又 包 
括 相 关 的 处 理 过 程 。 例 如 ， 可 以 这 样 写 : 
define typPpe StackTYpe to be 
fint StackEntries[20]; 
int StackPointer = 人 ; 
procedure pushtvalue) 
{StackEntries[StackPointer] * 一 Value; 


StackPointer < 一 StackPointer 十 1: 


} 
procedure pop . ,， ， 


} 


这 些 语句 是 用 来 表明 : StackType 类 型 与 称 为 StackEntries 和 StackPointer 的 变量 相关 ， 也 与 称 为 
push 和 pop 的 过 程 相交。( 为 了 简化 ， 这 里 包括 了 一 个 非常 简单 的 push 过 程 版 本 。 实 际 上 ， 这 个 
过 程 在 插入 一 个 新 项 前 ， 应 该 要 保证 栈 不 能 满 。) 

利用 这 个 扩展 过 的 StackType 类 型 定义 ， 就 可 以 通过 语句 ; 
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StackType StackOne, StackTwo, StackThree; 
来 声明 StackOne、StackTwo 和 StackThree 都 是 栈 。 然 后 ， 通 过 诸如 下 面 的 语句 : 


StackOne-push(25); 


把 项 压 入 这 些 栈 中 。 该 语句 表示 用 值 23 作 为 实际 参数 , 进而 执行 与 StackOne 相 关联 的 push 过 程 。 

这 里 ， 将 包含 了 操作 定义 的 用 户 自 定义 数据 类 型 称 为 抽象 数据 类 型 (abstract data type)。 押 
以 ， 相 对 于 那些 更 为 基本 的 用 户 自 定义 数据 类 型 而 言 ， 抽 象 数据 类 型 就 是 完整 的 数据 类 型 。 在 
20 世 纪 80 年 代 ， 抽 象 数 据 类 型 出 现在 诸如 Ada 之 类 的 语言 中 ， 这 就 代表 了 在 编程 语言 设计 方面 
前 进 了 一 大 步 。 在 今天 ， 面 向 对 象 语言 提供 了 称 为 类 的 抽象 数据 类 型 的 扩展 版 本 ， 在 下 一 节 中 
将 会 介绍 到 。 


问题 与 练习 

1. 数据 类 型 与 该 数据 类 型 的 一 个 实例 之 间 有 什么 不 同 ? 
2. 用 户 目 定 义 数 据 类 副 与 抽象 数据 关 型 之 间 有 什么 不 同 ? 
3, 请 描述 用 来 实现 一 个 表 的 抽象 数据 头 型。 

4. 请 描述 用 来 实现 支票 账户 的 抽象 数据 类 型 。 


于 人 


古 下 9 1 中 2 站 安 用- 
1 am 一 PPPTA -FT PUTL 


在 第 6 章 中 我 们 已 经 讨论 过 ， 面 向 对 象 范 型 导致 了 系统 可 由 称 为 对 象 的 单元 组 成 ， 而 任务 是 
通过 对 象 之 间 的 相互 作用 来 完成 的 。 每 个 对 象 就 是 一 个 实体 ， 并 啊 应 来 自 其 他 对 象 的 消息 。 对 
象 由 称 为 类 的 模板 来 描述 。 

在 许多 方面 ， 这 些 类 实际 上 就 是 抽象 数据 类 型 的 描述 〈 它 们 的 实例 称 为 对 象 )。 事 实 上， 在 
许多 流行 的 面 癌 对 象 程 序 设 计 语 言 中 ,用 来 定义 类 的 语句 与 上 贡 中 介绍 的 definetype 语 句 非 党 相 
似 。 举 例 来 说 ， 图 8-27 承 表示 了 ， 在 Java 语 言 和 C# 语 言 中 ， 如 定义 一 个 称 为 StackOflntegers 的 
类 .。( 在 C++ 语言 中 ， 等 价 类 的 定义 具有 相同 的 结构 ， 但 在 语法 上 稍微 有 所 不 同 。) 可 以 注意 到 ， 
这 里 的 类 与 上 一 节 摘 述 抽象 数据 类 型 StackType 所 用 的 define type 语 多 之 国有 些 类 似 。 这 里 所 描 
述 的 类 /类 型 包括 了 一 个 称 之 为 StackEntries 的 整 型 数组 ， 一 个 用 来 确定 数组 中 栈 顶 位 置 的 整数 ， 
将 其 称 之 为 StackPointer， 以 及 一 共用 来 处 理 栈 的 过 程 。 

吼 二 已 呈 号” 往 记 总 安 基 白土 工 mi 已 可 已 工 号 


{PTIVate int[] SackEntries = mewW int[20]， 
PBIILVate 工 nt 引 CKPOinter = 0， 


PuUbJlIC VelOG DPUShTIntL NewEnmErY ) 
{ 宇 【SS 七 忌 它 大 PODinteIr 二 20] 


SaCKEDmtIIeSTStaCKPOInEer++]】 = MewEntry， 
} 


PuUblaie 1 总 D 人) 

{ 工 主 【号 七 间 忆 长 世 已 二 mi 七 已 荆 和 站) 和 所 七 记 王 世 号 七 喜 尼 其 蕊 站 七 工 工 会 S [一 一 对 七 忌 刀 KKPOinmnt 上 ET] ; 

忆 号 已 工人 上 rm 

} 
| 





图 8-27 Java 和 C# 语 言 中 实现 的 整数 栈 
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标准 模板 库 
本 章 所 讨论 的 数据 结构 已 经 成 为 标准 的 编程 钻 构 ， 事 实 上 ， 因 为 其 标准 性 ， 以 至 于 许多 
编程 环境 都 把 它们 当 必 原 语 一 样 对 待 。 在 C++ 编程 环境 中 就 可 以 找到 一 个 例子 ， 即 通过 标准 
模板 库 〈Standard Template Library，STL ) 使 该 环境 的 功能 更 为 强大 。STL 中 包含 了 一 组 预先 
定 头 好 的 类 ， 这 些 类 是 用 来 描述 第 用 的 数据 结构 。 因 此 ， 通 过 在 C++ 程序 中 并 入 STL 的 这 种 
方式 ， 程 序 员 就 可 以 从 描述 这 些 结 构 细 节 的 工作 中 解放 出 来 ， 他们 所 需要 做 的 工作 仅仅 就 是 
声明 所 揽 的 标识 符 是 什么 类 型 就 行 ， 就 像 在 8.6 节 中 将 Stackcne 声 明 为 StackOfIntegers 
类 型 那样 。 
在 Java 或 C# 程 序 中 ， 可 以 利用 这 个 类 作为 模板 ， 用 以 下 语句 来 创建 一 个 名 为 Scackone 的 对 象 : 
号 七 吉它 所 避 于 工 训 证 全 宫 eTS SS 上 吕 CKOnE = 了 BeWwW SLCKOfTInteSGeTS1T) ; 
或 者 在 C++ 程序 中 ， 则 用 以 下 语句 来 创建 该 对 象 : 
号 七 总 安 大 口 二 工 半 已 扣 司 S St 号 CKOnme 1 ) : 
在 以 后 的 程序 中 ， 使 用 以 下 语句 ， 可 以 将 值 106 压 入 到 Stackone 栈 中 : 
SScCKOnE .Dushi1L0O6) ; 
或 者 可 以 用 下 面 的 语句 把 stackone 的 栈 顶 元 素 读 取 到 变量 oldavalue 中 : 
OleavValue = StackoOne .PoDp 1() ; 


这 些 特征 与 抽象 数据 类 型 的 那些 特征 本 质 上 是 一 样 的 。 然 而 ， 类 与 抽象 数据 类 型 之 间 还 是 
有 些 区 别 的 。 前 者 是 后 者 的 扩展 。 例 如 ， 如 在 选读 的 6.5 节 中 已 经 介绍 过 的 ， 面 向 对 象 语言 允许 
关 从 其 他 的 类 继承 属性 ， 并 包括 称 为 构造 器 的 专门 方法 ， 当 创建 对 象 时 ， 用 其 来 定制 个 性 化 的 
对 象 。 而 且 ， 类 通常 都 有 不 同 程度 的 封装 性 〈 见 6.5 节 )， 这 样 就 可 以 避免 其 实例 的 内 部 属性 受 
非 正 利 的 访问 。 最 后 ， 类 可 以 作为 一 种 对 相关 过 程 分 组 的 方法 ， 因 此 ， 类 可 以 只 由 过 程 定义 所 
组 成 。 从 这 个 惩 义 上 讲 ， 可 以 把 类 称 为 抽象 类 型 ， 而 不 是 抽象 数据 类 型 。 

最 后 可 以 得 出 总 结 : 类 和 对 象 的 概念 体现 了 程序 中 数据 抽象 的 表示 技术 又 前 进 了 一 大 步 。 事 实 
上 ， 正 是 由 于 这 种 以 方便 的 方式 来 定义 和 使 用 抽象 的 能 力 ， 才 导致 了 面向 对 象 设 计 范 型 的 流行 。 


问题 与 练习 
1. 抽象 数据 类 型 与 类 在 哪些 方面 类 似 ? 在 哪些 方面 存在 着 不 同 ? 
2. 类 与 对 象 有 什么 不 同 ? 
3. 请 描述 一 个 类 ， 要 求 用 该 类 作为 构建 整数 队列 类 型 对 象 的 模板 ， 


于 一 二 -下 让 和 本 时 1 二 上 上 读 站 .时 和 FT 本 下 上 开 下 和 nrE 站 证 


5 和 庆生 基 让 一 


在 本 童 中 已 经 介绍 过 指针 ， 并 介绍 了 如 何 利用 指针 来 构建 数据 结构 。 本 节 中 ， 我 们 将 讨论 
如 何在 机 器 语言 中 处 理 指 针 。 

余 议 我 们 要 用 附录 C 中 所 描述 的 机 器 语言 写 一 个 程序 , 要 求 从 图 8-12 所 描述 的 栈 中 弹出 一 个 
项 ， 然 后 将 其 放 入 到 一 个 通用 寄存 器 中 。 换 名 话说， 就 是 要 将 存储 单元 中 的 内 容 加 载 到 一 个 寄 
存 器 中 ， 而 这 个 存储 单元 包含 的 是 栈 顶 的 项 。 我 们 的 机 器 语言 提供 了 两 条 指令 用 于 加 载 寄存 器 ; 
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一 条 指令 是 用 操作 码 2， 另 一 条 指令 是 用 操作 码 1。 回 想 一 下 ， 在 操作 码 2 的 情况 中 ， 操 作 数 字段 
包 售 了 被 加 载 的 数据 ， 而 在 操作 码 1 的 情况 中 ， 操 作 数 字段 则 包含 了 被 加 载 数 据 的 地 址 。 

由 于 不 知道 内 容 是 什么 ， 所 以 用 操作 码 2 达 不 到 预期 目的 。 而 且 ， 不 知道 地 址 ， 也 不 能 用 操 
作 码 1。 毕 竟 ， 在 程序 执行 的 时 候 ， 栈 顶 的 地 址 会 发 生变 化 。 然 而 ， 我 们 知道 了 栈 指针 的 地 址 。 
也 就 是 说 ， 知 道 了 所 要 加 载 数 据 的 地 址 的 位 置 。 于 是 ， 我 们 需要 的 就 是 第 3 个 用 于 加 载 寄 存 器 的 
操作 码 ， 在 这 条 指令 中 ， 操 作 数 字段 包含 了 指向 被 加 载 的 数据 指针 的 地 址 。 

为 了 自 现 这 个 目标 ， 我 们 对 附录 C 中 的 机 器 语言 进行 扩展 ， 使 其 包含 操作 码 D。 用 这 个 操作 
码 的 一 条 指令 可 能 具有 这 样 的 形式 ， 即 PRXY， 这 就 表示 将 地 址 XY 中 的 内 容 为 地 址 的 存储 单元 
的 内 容 加 载 到 寄存 器 R 中 ( 见 图 8-28)。 所 以 ， 人 则 指令 D5AA 
就 实现 了 将 栈 顶 的 数据 加 载 进 寄存 器 5 中 。 

CPU 主 存 情 器 
寄存 器 5 指令 寡 存 器 “存储 器 的 何 处 “AA 中 的 指针 
2 
总 线 


四” 辽 - 蔬 ”四 本 四 村 国 且 | em 汪 | 旺 天 本 ,十 1 二 二 加 了 辣 , 同 怀 





在 机 器 周期 的 执 
行 阶段 传输 给 寄 
存 器 的 数据 


图 8-28 利用 指针 扩展 附录 C 中 机 器 语言 的 首次 尝试 


然而 ， 这 条 指令 并 没有 完成 出 栈 操作 。 我 们 还 必须 将 栈 指针 减 1， 以 便 让 它 指向 新 的 栈 顶 。 
这 也 就 是 说 ， 在 加 载 指令 之 后 ， 机 器 语言 程序 还 必须 党 术 指 杀 加 壹 到 “个 寄 存 器 ， 将 其 减 去 1， 
然后 再 把 结果 存 回 到 存储 器 。 
如 扫 不 用 重 储 单 元 ， 而 用 某 个 寄存 器 来 作为 栈 指针 ， 那 么 就 可 以 减少 栈 指 针 在 寄存 器 与 存 
储 器 同 的 来 回 移动 。 但是， 这 也 就 意味 着 必须 重新 设计 加 载 指令 ， 使 其 希望 的 指针 在 寄存 器 中 ， 
而 不 是 在 主 存 中 。 这 样 一 来 ， 代 替 早 些 时 候 那 个 方案 ， 可 以 用 操作 码 D 定 义 一 条 指令 ， 令 其 具 
有 DR0S 的 形式 ， 这 就 表示 将 寄存 器 S 所 指 的 存储 单元 的 内 容 加 载 到 寄存 器 R〈 见 图 8-29)。 于 是 ， 
一 个 完整 的 出 栈 操 作 就 可 以 这 样 来 完成 : 在 这 条 指令 之 后 跟随 一 条 指令 〈 或 几 条 指令 )， 将 存放 
在 寄存 器 $ 中 的 值 减 去 1。 


CPU 指令 指示 主 存储 器 
二 二 本 元 归 , 思 个 寄存 
i 许 全 放 看 -有 :1 
0 在 机 器 周期 的 执 
千 生 器 4 行 阶段 传输 给 麻 
存 器 的 数据 





图 8-29 ”把 存放 在 寄存 器 中 的 一 个 指针 指向 的 存储 器 单元 内 容 加 载 到 一 个 寄存 器 中 
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可 以 注意 到 ， 要 实现 信 栈 操作 ， 还 需要 一 条 类 似 的 指令 。 所 以 ， 还 需要 对 附录 C 中 所 描述 
的 机 器 语言 做 进一步 的 扩展 ， 使 其 引入 操作 码 E， 这 样 一 来 ，ER0S 的 指令 形式 就 表示 把 寄存 器 
R 的 内 容 存 放 到 由 寄存 器 S 所 指向 的 存储 单元 中 。 同 样 ， 为 了 完成 入 栈 操作 ， 在 这 条 指令 之 后 中 
随 一 条 指令 〈 或 儿 条 指令 )， 将 寄存 器 S 中 的 值 加 上 1。 

我 们 所 提出 的 这 些 新 的 操作 码 D 和 E， 不 仅 表明 了 所 设计 的 机 器 语言 是 如 何 处 理 指针 的 ， 它 
们 还 表明 了 最 初 的 机 器 语言 中 没有 提 到 的 寻 址 技术 。 正 如 附录 C 中 所 提 到 的 ， 机 器 语言 用 两 种 
方式 来 确定 一 条 指令 中 所 涉及 的 数据 。 第 一 种 方式 就 是 通过 一 条 操作 码 为 2 的 指令 来 表示 。 在 这 
里 ， 操 作 数 字段 就 明确 包括 了 所 涉及 的 数据 。 这 种 寻 址 技术 称 为 立即 寻 址 (immediate 
addressing ) 。 确定 数据 的 第 二 种 方式 则 用 操作 码 为 1 和 3 的 指令 来 表示 。 在 这 里 ， 操 作 数字 段 包 
含 的 是 所 涉及 的 数据 的 地 址 。 这 种 寻 址 技术 称 为 直接 寻 址 《direct addressing)。 然 而 ， 我 们 所 提 
出 的 新 操作 码 D 和 BE 则 表明 还 有 另 一 种 确定 数据 的 形式 。 这 些 指令 的 操作 数字 段 包含 的 是 数据 地 
址 的 地 址 。 人 (indirect addressing)。 所 有 的 这 3 种 寻 址 技术 在 今天 的 
机 器 语言 中 是 比较 常 


问题 与 练习 
1 假 食 附录 C 中 质 描 述 的 机 器 语言 已 有 了 本 节 最 后 所 做 的 扩展 ， 而 且 ， 假 定 寄 存 器 8 中 的 内 容 为 DB， 而 
地 竹 为 DB 的 存储 单元 中 的 内 容 为 CA， 并 且 地 址 为 CA 的 存储 单元 的 内 容 为 A5。 请 问 ， 在 执行 了 下 面 
的 每 条 指令 后 ， 寄 存 器 和 中 的 内 容 是 什么 ? 
a，25SAS b，15SCA ec，DSs08 

- 利用 本 节 最 后 所 描述 的 扩展 ， 写 一 段 完整 的 机 器 语 党 程序 ， 来 完成 出 栈 操 作 。 假 设 栈 是 按 图 8-12 所 示 
的 方式 实现 的 ， 栈 指针 在 寄存 器 F 中 ， 并 压 ， 栈 顶 出 栈 后 压 入 寄存 器 5 中 ， 

. 利用 本 节 最 后 所 描述 的 扩展 ， 写 一 段 程序 ， 将 从 地 址 A0 开 始 的 5 个 连续 的 存储 单元 的 内 容 复制 到 从 地 
址 BO 开始 的 S$ 个 存储 单元 。 这 里 假设 程序 的 起 始 地 址 为 00。 

. 在 本 章 中 ， 己 经 介绍 过 DR0S 这 样 一 种 形式 的 机 器 指令 。 假 设 将 这 个 形式 扩展 为 DRXS， 其 意义 为 ， 
把 寄存 器 S 中 的 值 加 上 值 X， 然 后 将 结果 所 指向 的 数据 加 载 到 寄存 器 R 中 ”。 这 样 一 来 ， 通 过 读 取 寄 
存 器 S 中 的 值 ， 再 加 上 值 X， 就 可 以 得 到 指向 数据 的 指针 。 寄 存 器 $ 中 的 值 不 会 发 后 变化 。《〈 如 果 寡 存 
峡 E 的 内 容 为 04， 那 么 指令 DE2F 就 把 地 址 为 06 的 存储 单元 的 内 容 加 载 到 寄存 器 E 中 ， 而 寄存 器 FE 的 值 
保持 04 不 变 。) 请 问 : 这 条 指令 的 优点 是 什么 ?如果 一 条 指令 的 形式 为 DRTS， 即 表示 “把 寄存 器 $ 
的 仁和 寄存 器 T 的 值 相 加 ， 然 后 把 所 得 的 结果 所 指向 的 数据 加 载 到 寄存 器 R 中 ”， 那 么 这 条 指令 又 有 
什么 优点 ? 


上 


四 


全 


于 证 且 三 捕 秆 下 村 于 于 站 了 汪汪 站 和 头 Hi 二 二 和 开 此 -Ra 这 守卫 让 


复 3 题 加 
( 带 * 的 题目 涉及 选读 章节 的 内 容 )。 的 ， 其 起 始 地 址 为 20〈 十 进 制 )。 如 果 数 组 中 
1. 当下 列 数组 分 别 以 行 主 序 和 列 主 序 在 机 器 存 的 每 个 项 只 需要 一 个 存储 单元 ， 数 组 中 的 第 3 
储 器 中 存放 时 ， 试 画图 说 明 该 数组 的 存放 情 行 第 4 列 的 项 地 址 是 多 少 ? 如 果 每 个 项 需要 两 

况 . 个 存储 单元 ， 那 么 结果 又 如 何 ? 


[ia 


. 异 设 第 2 题 中 的 数组 是 以 列 主 序 而 不 是 以 行 主 
序 存放 的 ， 请 重新 做 第 2 题 。 

4. 如 果 想 利用 传统 的 一 维 同 构 数组 来 实现 动态 
表 ， 那 么 会 带 来 竺 样 的 复杂 问题 ? 

. 请 描述 一 种 用 来 存放 三 维 同 构 数 组 的 方法 。 请 

2. 假设 一 个 6 行 8 列 的 同 构 数组 是 按 行 主 序 存放 问 这 里 用 来 定位 第 面 、 第 / 行 、 第 k 列 的 项 的 地 
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= 


址 多 项 式 是 什么 ? 


. 假设 字母 表 A、B、C、D、E、F 和 G 存 放 在 一 


个 连续 的 存储 单元 块 中 , 假设 要 保持 表 的 字母 
顺序 ， 插 入 字母 D 则 需要 进行 哪些 操作 ? 


. 下 表 表 示 的 是 计算 机 主 存 中 的 一 些 存 储 单元 


的 户 容 以 及 每 个 单元 的 地 址 。 注意, 其 中 有 些 
单元 包含 字母 表 中 的 字母 , 而 这 样 的 每 个 单元 
后 面 都 跟随 一 个 空 单元 。 在 这 些 空 单元 中 填 入 
适当 的 地 址 , 使 得 每 个 包含 字母 的 单元 及 其 后 
的 单元 一 起 ， 构 成 一 个 链表 中 的 项 , 并且 该 链 





表 要 按 字 母 顺序 排列 。《〈 这 里 用 0 来 表示 NIL 
指针 。) 这 里 的 头 指针 包含 的 内 容 是 什么 ? 
地 址 内 容 

11 C 

12 

13 G 

14 

15 E 

16 

17 B 

18 

19 U 

20 

21 F 





:下面 的 表 代 表 的 是 计算 机 主 存 中 一 个 链表 的 


一 部 分 。 表 中 的 每 项 由 两 个 单元 组 成 : 第 一 个 
单元 包 售 的 是 字母 表 中 的 字母 , 第 二 个 单元 包 
会 的 是 指向 链表 下 一 项 的 指针 。 请 改变 指针 ， 
以 使 字母 N 不 再 出 现在 表 中 ， 然后， 用 字母 G 
代 蔡 字母 N， 并 改 表 相 应 的 指针 ， 使 新 字母 按 
字母 顺序 出 现在 表 中 的 合适 位 置 。 





地 址 内 容 
30 ] 
3] 38 
32 B 
33 30 
34 X 
35 46 
36 N 
37 40 
38 攻 
39 36 
40 P 
41 34 


9. 


到 
LEE 


下 面 的 表 所 表示 的 链表 与 前 面 几 题 所 使 用 的 
格式 相同 。 如 果 头 指针 包含 的 值 是 44, 那么 这 
个 雪 所 表示 的 名 字 是 什么 ? 改变 指针 , 使 得 这 
小 表 包 售 名 字 Jean。 








地 址 内 容 
40 N 
41 46 
中 3 I 
43 40 
44 本 
45 50 
4 下 
47 00 
48 M 
49 42 
50 入 
51 40 





- 下 面 的 哪 一 个 例 程 能 够 正确 地 做 到 ， 将 New- 


Entry 项 直接 捅 入 到 链表 中 名 为 Previous- 
Entry 的 项 的 后 面 ?” 而 另外 一 个 例 程 的 错误 
在 什么 地 方 ? 

例 程 1; 


1 .将 Previocusgntry 指 针 字 段 的 值 复制 到 
NewEntrvy 的 指针 字段 。 

2 .将 PreviousEntry 指 针 字 段 的 值 改 成 
NewEntry 的 地 址 。 


例 程 2: 


1. 将 BreviousEntrvy 指 针 字 段 的 值 改 成 
NewEntry 的 地 址 。 

2. 将 PrevicousEntry 指 针 字 段 的 值 复制 到 
NewEntrvy 的 指针 字段 。 


.设计 一 个 过 程 , 将 两 个 链表 连接 起 来 (也 就 是 


说 ， 把 一 个 链表 放 到 另 一 链表 的 前 面 ， 形 成 一 
个 链表 )。 


. 设计 一 个 过 程 , 将 两 个 排序 过 的 邻接 表 合 并 成 


一 个 排序 过 的 邻接 表 。 如 果 表 是 链接 型 的 ， 那 
么 结果 又 如 何 ? 


:说 计 一 个 过 程 ， 对 一 个 链表 进行 反 向 排列 。 
- 纪 设 计 一 个 算法 ， 利 用 栈 作 为 辅助 存储 结构 ， 


以 尽 厅 打印 出 一 个 链表 。 

b. 说 计 一 个 递归 过 程 来 完成 同样 的 任务 , 而 不 
亚 陈 使 用 栈 结构 。 在 这 个 递归 的 解决 方案 
中 ， 会 以 什么 样 的 形式 涉及 栈 ? 
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15， 


1 


| 


]8， 
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有 时 候 , 一 个 单 链表 可 以 有 两 种 不 同 的 排序 ， 
只 要 每 一 项 附加 两 个 指针 , 而 不 是 一 个 指针 。 
请 填充 下 表 ， 使 得 通过 紧 跟 每 个 字母 的 第 一 
个 指针 ， 就 可 以 找到 名 字 Carol， 而 通过 紧 跟 
每 个 字母 的 第 二 个 指针 ， 就 可 以 按照 字母 顺 
序 找到 字母 。 这 两 个 表 的 头 指针 分 别 代表 什 
委 值 ? 








地 址 内 容 
60 O 
61 
62 
63 C 
人 
6 
66 A 
67 
68 
69 L 





' 下 表 表 示 的 是 文中 所 讨论 过 的 , 存放 在 连续 存 


储 单元 块 中 的 一 个 栈 。 如 果 这 个 栈 的 栈 底 地 址 
是 10， 而 栈 指针 包含 值 12， 那 么 ， 一 个 出 栈 指 
令 取出 的 是 什么 值 ? 在 出 栈 操作 后 , 栈 指针 又 
为 何 值 ? 





内 容 





虽 居 站 可 


14 忆 





' 企 第 16 昕 中 , 如 果 执 行 的 指令 是 向 栈 中 压 入 字 


母 D， 而 不 是 弹出 一 个 字母 ， 那 么 请 画 出 一 个 
表 来 显示 出 存储 单元 中 最 后 的 内 容 。 在 执行 入 
栈 指 令 后 ， 栈 指针 的 值 是 什么 ? 
设计 一 个 过 程 ， 从 一 个 栈 中 删除 栈 底 项 ， 而 栈 
中 的 其 他 项 保持 不 动 。 这 里 只 能 用 出 栈 和 入 栈 
操作 来 访问 栈 。 为 了 解决 这 个 问题 , 还 需要 用 
到 什么 样 的 辅助 存储 结构 ? 


. 设计 一 个 过 程 ， 比 较 两 个 栈 的 内 容 。 
.假设 给 你 两 个 栈 , 如 果 一 次 只 允许 你 从 一 个 楼 


2 


2 


22. 


3 


[ij 


24. 


5 


2 


vv 


2 7 


28. 





移 一 个 项 到 另 一 个 栈 , 那么 原始 的 数据 将 可 能 
进行 怎样 的 一 些 重 排 ? 如 果 给 你 3 个 栈 ， 那 么 
会 有 怎样 的 安排 ? 


. 假设 给 你 3 个 栈 ， 并 且 一 次 只 允许 你 从 一 个 栈 


移 一 个 项 到 另 一 个 栈 。 设 计 一 个 算法 , 把 其 中 
一 个 栈 中 的 两 个 相 邻 项 颠倒 。 

假设 要 创建 一 个 存放 名 字 的 栈 , 其 名 字 的 长 度 
不 同 。 如 果 把 名 字 存 放 在 分 散 的 存储 区 域 ， 再 
建立 一 个 指向 这 些 名 字 的 指针 的 栈 , 而 不 是 人 允 
许 栈 存 放 名 字 本 身 , 请 解释 一 下 为 什么 这 样 做 
更 方便 ? 

队列 在 存储 器 中 是 向 其 头 方 向 移动 ,还 是 向 其 
尾 方 网 移动 ? 

假设 要 实现 一 个 “队列 ”， 而 该 队列 中 的 新 项 
都 有 相应 的 优先 级 。 这 样 ， 一 个 新 的 项 就 会 被 
放 在 那些 优先 级 较 低 的 项 前 面 。 请 描述 一 个 实 
韦 基 梓 的 “队列 ”的 存储 系统 ， 并 证 明 你 的 结 
沦 的 正确 性 。 

假设 队列 中 的 每 个 项 需要 一 个 存储 单元 , 其 头 
指针 包含 值 11， 尾 指针 包含 值 17。 那 么 请 问 ， 
当 队 列 中 播 入 了 一 个 项 ， 同 时 移 走 了 两 个 项 ， 
那么 这 些 指针 的 值 又 为 多 少 ? 


. a. 假 设 一 个 队列 是 以 循环 队列 的 形式 实现 的 ， 


其 状态 如 下 图 所 示 。 请 画 出 一 个 图 ， 用 来 表 
示 处 在 插入 字母 G 和 R， 移 走 两 个 项 ， 再 揪 
人 字母 D 和 P 之 后 的 结构 。 





b. 在 (a 中 ， 如 果 在 没有 移出 任何 字母 之 前 ， 就 
插入 字母 G、R、D 和 P， 那 么 会 发 生 什么 样 
的 错误 ? 

在 用 高 级 语言 编写 的 一 个 程序 中 , 请 描述 一 下 

怎样 用 数组 来 实现 队列 。 

假设 有 两 个 队列 , 一 次 只 允许 从 一 个 队列 的 头 

部 移 一 个 项 到 任何 一 个 队列 的 队 尾 .请 设计 一 

个 算法 ， 把 其 中 一 个 队列 的 相 邻 两 项 颠倒 。 


. 下 表 表 示 的 是 存放 在 计算 机 存储 器 中 的 一 村 


树 。 树 的 每 个 结 点 有 3 个 单元 。 第 一 个 单元 存放 
的 是 数据 (字母 ) 第 二 个 单元 包含 的 是 指向 该 
结 点 左 子 结 点 的 指针 ， 第 三 个 单元 包含 的 是 指 
向 该 结 点 右 子 结 点 的 指针 。0 值 代表 NIL 指 针 。 
如 宁 根 指针 的 值 是 55， 那 么 请 画 出 这 棵 树 。 


30， 





蜂 
钱 
填 
遇 





53 
56 
呈 


下 表 表 示 的 是 计算 机 主 存 中 一 个 单元 块 的 内 
容 。 注意 , 一 些 单 元 中 包含 的 是 字母 表 中 的 字 
母 , 而 每 个 这 样 的 单元 后 面 都 跟 有 两 个 空格 单 
元 。 填充 这 些 空格 单元 ,使 得 这 个 存储 块 表示 
表 下 面 的 那 棵 树 。 这 里 用 字母 后 的 第 一 单元 作 
为 指向 左 子 结 点 的 指针 , 而 接 下 来 的 那个 单元 
则 作为 指向 右 子 结 点 的 指针 。 用 0 表示 NIL 指 
针 。 根 指针 的 值 应 该 为 多 少 ? 


[向 
此 
性 








地 址 内 容 
30 C 
31 
32 
33 H 
34 
35 
36 用 
37 
38 
39 E 
40 
41 
42 G 
43 
过 才 


了 


[一 


3 了， 


33. 


34. 


35 


36. 


317. 


3 了 8. 


区， 


AR 
C K 
昌 
E H 


, 设计 一 个 非 递归 算法 来 代替 图 8-21 所 未 的 志 


归 算法 。 

设计 一 个 非 递 妇 算法 来 代替 图 8-24 押 示 的 闻 
归 算 法 。 利 用 一 个 栈 来 控制 必要 时 的 回溯 。( 木 
语 回溯 是 指 以 进入 系统 的 反方 向 从 系统 回 出 
的 过 程 。 一 个 典型 的 例子 就 是 在 森林 中 , 沿 着 
自己 进入 森林 的 脚步 找 出 走出 森林 的 路 .在 本 
题 中 ,回潮 是 为 了 寻找 树 的 另 一 个 分 支 ， 而 找 
到 退出 树 的 路 径 。 ) 

应 用 图 8-24 中 所 示 的 打印 树 的 递归 算法 。 画 出 
一 个 图 ,用 来 表示 在 打印 X 结 点 时 该 算法 的 鸯 
套 活 动 《 以 及 每 个 活动 的 当前 位 置 )。 

在 保持 根 结 点 相同 , 而 且 也 不 改变 数据 元 素 的 
物理 位 置 的 情况 下 ， 请 改变 第 29 题 中 树 的 指 
针 , 使 得 图 8-24 中 所 示 的 树 打印 算法 按 字 母 顺 
序 打印 出 络 操 。 


. 如 果 下 面 的 二 叉 树 不 用 指针 ， 而 以 8.3 节 中 所 
描述 的 用 连续 存储 单元 块 方法 仓 放 , 请 函 出 一 . 


个 图 , 用 来 表示 该 二 叉 树 在 存储 器 中 是 如 何 存 
储 的 。 


LA NA 
和 
Y A 


假设 如 8.3 节 中 所 描述 的 ， 用 连续 存储 单元 来 
表示 二 叉 树 ， 其 值 分 别 为 A、B、C、D、E 和 FF。 
请 画 出 这 个 树 的 图 。 

举 一 个 例子 ， 可 以 把 一 个 表 〈 概 念 结构 ) 实现 
为 一 棵 树 (实际 的 底层 结构 )。 再 举 一 个 例子 ， 
可 以 把 一 棵 树 〈 概 念 结构 ) 实现 为 一 个 表 〈 实 
际 的 请 技 纺 构 ) 。 

文中 所 讨论 的 链接 树 结构 包含 有 指针 , 这 了 碱 使 
得 可 以 沿 着 树 从 父 结 点 下 移 到 子 结 点 。 请 描述 
一 个 指针 系统 , 可 以 沿 着 树 从 子 结 点 上 移 到 父 
结 点 。 兄 弟 结 点 之 间 的 移动 又 如 何 ? 

请 描述 一 个 数据 结构 , 要 求 该 数据 结构 庆 用 于 
表示 在 下 棋 游 戏 时 的 檬 盘 布局 。 


1] 


已 
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40. 如 果 按 照 图 8-24 所 示 的 算法 ， 判 断 下 列 几 棵 样 的 过 程 来 处 理 这 个 名 单 ?〈 没 有 必要 包括 过 
树 , 哪 棵 树 的 结 点 会 按照 字 母 顺 序 打 印 出 来 ? 程 的 请 详细 说 明 。 ) 

区 47. 利用 8.5 节 介绍 的 difine type 的 代码 语句 ， 拟 

PR \ 定 一 个 表示 队列 的 抽象 数据 类 型 然后 再 给 出 

AR 0 伪 代 码 语句 ， 说 明 如 何 创 建 这 个 类 型 的 实例 ， 
以 及 如 何在 这 些 实例 中 插入 和 删除 项 。 

41. 修改 图 8-24 中 的 过 程 ， 使 得 能 按 倒 序 打印 出 48, a. 抽 和 象 数据 类 型 和 基本 数据 类 型 之 间 的 区 别 
“ 表 ”。 是 什么 ? 

42. 摘 述 一 个 树 结 构 , 将 其 用 来 存放 一 个 家 族 的 家 b. 抽 象 数据 类 型 与 用 户 自 定义 数据 类 型 之 间 
谱 . 对 该 树 会 进行 一 些 什么 样 的 操作 ? 如 果 该 的 区 别 是 什么 ? 

树 是 用 链接 结构 来 实现 的 , 每 个 结 点 应 该 关联 49. 试 确 定 用 来 表示 地 址 短 的 抽象 数据 类 型 中 可 
一 些 什 么 样 的 指针 ? 假设 这 个 树 就 是 按照 你 能 会 出 现 的 数据 结构 和 过 程 。 

刚才 押 摘 述 的 指针 ， 并 以 链接 结构 实现 ,请 设 50. 试 确定 用 来 表示 视频 游戏 中 一 个 简单 航天 器 
计 相 应 的 过 程 来 完成 你 所 定义 的 上 述 操作 。 利 的 抽 银 数据 类 型 中 可 能 出 现 的 数据 结构 和 过 
用 你 设计 的 存储 系统 , 解释 一 下 如 何 才能 找到 程 。 

一 个 人 的 所 有 兄弟 。 *51. 修改 图 8-27， 使 得 该 类 定义 的 是 一 个 队列 ， 而 

43. 如 果 一 棵 树 是 按 图 8-20 所 示 的 形式 存放 的 , 请 人 不 是 栈 。 
设计 一 个 过 程 来 从 这 棵 树 中 找到 并 删除 给 定 +52, 类 与 传统 的 抽 银 数据 类 型 相 比 , 在 哪个 方面 更 
的 值 。 通用 ? 

44. 在 树 的 传统 实现 方式 中 , 构造 的 每 个 结 点 都 会 *53. 利用 8.7 节 最 后 描述 的 DROS 和 ER0S 的 指令 形 
为 其 每 个 可 能 的 子 结 点 分 别 留 有 指针 。 所 设计 式 ， 写 一 个 完整 的 机 器 语言 例 程 ， 向 图 8-12 
的 这 种 指针 的 数目 决定 了 任何 结 点 所 拥有 的 中 所 实现 的 栈 中 压 入 一 个 项 。 这 里 假设 栈 指针 
子 结 点 的 最 大 数目 。 如 果 一 个 结 点 的 子 结 点 数 放 在 寄存 器 F 中 ， 而 要 压 入 的 项 在 寡 存 器 5 中 。 
目 少 于 指针 数目 ， 则 将 有 些 指针 简单 地 署 为 *54. 假设 链表 中 的 每 个 项 都 由 一 个 存放 数据 的 存 
NIL 即 可 。 但 是 ， 这 样 的 一 个 结 点 不 可 能 拥有 储 单 元 以 及 指 岗 下 一 项 的 指针 构成 。 而 且 , 假 
比 指针 数目 更 多 的 子 结 点 。 请 描述 一 下 ,如 何 设 一 个 位 于 存储 器 地 址 A0 的 新 项 要 搬入 到 位 
实现 一 棵 树 , 而 不 限制 其 结 点 所 拥有 的 子 结 点 于 地 址 B5$ 和 C4 的 项 之 间 。 利 用 附录 C 中 描述 的 
数 。 语言 ， 以 及 8.7 节 最 后 所 描述 的 附加 操作 码 D 

45. 利用 8.5 节 介绍 的 difine type 伪 代码 语句 ， 定 和 E， 号 一 个 机 器 语言 例 程 来 实现 这 个 插入 操 

义 一 个 用 户 自 定义 数据 类 型 ,用 来 表示 关于 公 作 。 
司 员工 情况 的 数据 (如 和 名字、 地 址 、 工作 职务 、 *55. 8.7 节 所 描述 的 DROS 指 令 形 式 与 DRXY 指 令 形 
工资 级 别 等 ) 。 式 相 比 有 什么 优势 ? 在 8.7 节 的 问题 与 练习 4 

46. 利用 8.5 节 介绍 的 difine type 念 代码 语句 ， 拟 中 所 描述 的 DRXS 指 令 形 式 与 DROS 指 令 形式 
定 一 个 表示 名 单 的 抽象 数据 类 型 。 具 体 来 说 ， 相 比 有 什么 优势 ? 

用 什么 样 的 结构 来 包含 这 个 名 单 ? 提供 什么 
会 问题 


下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问 题 。 回 答 这 些 问题 不 
十 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 
1 假设 一 个 软件 分 析 师 设计 了 一 个 数据 组 织 ， 该 数据 组 织 能 在 一 个 特定 的 应 用 中 有 效 地 处 
理 数 据 。 那 么 该 如 何 保护 对 这 个 数据 结构 的 权益 呢 ? 数据 结构 是 否 是 一 种 思想 表达 (好 
比 一 首 诗 )， 所 以 也 可 以 通过 版 权 来 进行 保护 ? 还 是 也 像 算 法 一 样 ， 钴 了 同样 的 法 律 空 
子 ? 用 专利 法 呢 ? 


必 
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. 在 何 种 的 程度 上 ， 错 误 的 数据 比 没 有 数据 更 糟糕 ? 
. 在 许多 应 用 程序 中 ， 栈 可 以 生长 到 的 大 小 取 雇 于 可 用 的 存储 器 容量 。 如 果 可 用 的 空间 已 


经 耗 尽 ， 那 么 所 设计 的 软件 就 会 产生 一 条 消息 ， 诸 如 “ 栈 谥 出 ”等 ， 并 终止 程序 。 在 大 
多 数 场 合 ， 这 种 错误 从 不 会 发 生 ， 而 且 用 户 也 从 不 会 意识 到 这 个 错误 。 但 是 ， 如 果 这 种 
错误 发 生 了 ， 并 且 丢 失 了 敏感 的 数据 ， 那 么 谁 将 对 此 负责 ? 软件 的 开发 者 怎样 减轻 自己 
的 责任 ? 


. 在 基于 指针 系统 的 数据 结构 中 ， 删 除 一 个 项 通常 是 通过 改变 指针 ， 而 不 是 控 掉 存储 单元 


来 办 到 的 。 这 样 一 来 ， 当 链表 的 一 项 被 删除 后 ， 这 个 删除 的 项 实际 上 还 留 在 存储 器 中 ， 
直到 这 个 存储 空间 被 其 他 的 数据 用 掉 。 这 种 被 删除 数据 存留 的 状况 会 产生 什么 样 的 道德 
和 安全 方面 的 问题 ? 


. 数据 和 程序 可 以 方便 地 从 一 台 计 算 机 传送 到 另 一 台 计 算 机 。 这 样 一 来 ， 一 台 机 器 所 拥有 


的 知识 也 可 以 很 容易 地 传送 给 许多 机 器 。 相 反 ， 对 人 而 言 ， 要 把 知识 从 一 个 人 传 给 另 一 
个 人 ， 有 时 候 得 花 很 长 的 时 间 。 例如， 一 个 人 要 教会 另 一 个 人 一 种 新 语言 ， 那 得 花 时 间 。 
如 果 机 器 的 能 力 开 始 挑战 人 的 能 力 ， 那 么 这 种 在 知识 传输 率 上 的 反差 将 意味 着 什么 ? 


' 指针 的 使 用 使 得 相关 的 数据 可 以 在 计算 机 存储 器 中 链接 起 来 ， 其 链接 方式 使 人 联想 到 ， 


信息 在 人 脑 中 也 是 采用 这 种 方式 关联 起 来 的 。 那 么 ， 这 样 一 种 在 计算 机 存储 器 中 的 链接 
与 人 脑 中 的 链接 有 怎样 的 相似 之 处 ? 它们 的 不 同 点 是 什么 ? 如 果 尝 试 着 把 计算 机 建造 得 
与 人 脑 更 相像 ， 那 么 这 在 伦理 上 是 否 可 取 ? 


: 计算 机 技术 的 普及 是 否 已 经 产生 了 新 的 道德 问题 ， 或 者 是 简单 地 提供 了 一 个 新 的 环境 ， 


而 在 这 样 的 环境 之 中 ， 原 来 的 那些 道德 规范 理论 是 否 还 有 用 ? 


. 假设 计算 机 科学 概论 课本 的 作者 想 包含 进 一 些 程序 的 例子 来 说 明文 中 的 概念 。 然 而 ， 为 


了 简明 ,许多 例子 必须 是 简化 版 本 ， 而 这 些 简 化 版 本 实际 上 可 以 用 在 专业 质量 的 软件 中 。 
该 作者 知道 ， 这 些 例 子 会 被 毫 不 怀疑 的 读者 所 使 用 ， 并 最 终 被 用 到 一 些 重要 的 软件 应 用 
中 去 ， 而 在 这 些 应 用 中 ， 采 用 更 为 健壮 的 技术 则 更 为 合适 。 作 者 应 当 采 用 这 些 简 化 版 的 
例子 ， 坚 持 认 为 即使 因为 简化 后 降低 了 它们 的 价值 ， 所 有 的 例子 仍 是 健壮 的 ， 还 是 作者 
拒绝 使 用 这 些 例子 ， 除 非 这 些 程序 例子 在 简明 性 和 健壮 性 方面 都 能 得 到 保证 ? 
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数据 库 系 统 


据 库 是 这 样 一 个 系统 ， 它 将 庞大 的 数据 集合 转化 成 一 个 抽象 工具 ， 为 用 户 提供 一 个 简 
使 的 方式 得 找 并 提取 相关 的 信息 项 。 本 章 将 讨论 这 个 主题 ， 另 外 还 将 讨论 一 个 数据 控 
气相 关 领 域 的 议题 。 数 据 挖 掘 技 术 ， 即 一 种 从 庞大 的 数据 集合 和 传统 文件 结构 中 发 现 隐藏 模式 的 
技术 ， 能 够 为 今天 的 数据 库 和 数据 挖掘 系统 提供 许多 基本 的 工具 。 
当今 的 技术 已 经 能 够 存储 相当 大 数量 的 数据 ， 但 是 ， 如 果 我 们 不 能 提取 与 手头 工作 相关 的 
和 用 信息 项 ， 那 么 这 样 的 数据 集 就 是 无 用 的 。 在 本 章 中 ， 我 们 将 研究 数据 库 系 统 ， 并 弄 清 这 些 
系统 是 怎样 利用 抽象 工具 从 庞大 的 数据 集合 中 提取 出 有 用 的 信息 。 作 为 相关 主题 ， 我 们 还 要 研 
完 数 据 挖 据 ， 即 一 个 与 数据 库 技 术 密切 相关 的 快速 发 展 的 领域 ， 其 目标 是 发 展 在 数据 集 上 确定 
和 辟 找 数据 的 模式 。 此 外 ， 我 们 还 将 学 习 传 统 文件 结构 的 原理 ， 因 为 它 支撑 了 现在 的 数据 库 和 
数据 挖掘 系统 。 
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9.1 数据库 基 础 


一 


术语 数据 库 〈database) 是 指 一 种 多 维 的 数据 集合 。 之 所 以 说 是 多 维 的 ， 是 因为 在 这 种 集合 
中 ,通过 数据 项 间 的 内 部 链接 ,信息 可 以 从 不 同 的 角度 来 获取 。 这 与 传统 的 文件 系统 5【 见 9.5 节 ) 
不 同 ; 传统 的 文件 系统 ， 有 时 也 称 为 平面 文件 (flat file)， 是 一 种 一 维 的 存储 系统 ， 因 为 它 只 从 
一 种 观点 来 展示 信息 。 比 如 ， 一 个 包含 关于 作曲 家 及 其 作品 信息 的 平面 文件 ， 也 许 只 能 提供 一 
修 按 作曲 家 分 类 的 作品 清单 ， 而 对 于 一 个 数据 库 来 说 ， 它 可 以 呈现 某 一 作曲 家 的 所 有 作品 ， 也 
可 以 是 某 一 类 音乐 作品 的 所 有 作曲 家 ， 也 可 以 是 编写 其 他 作曲 家 作品 的 变奏 的 那些 作曲 家 。 


9.1.1 数据 库 系统 的 重要 性 


从 历史 发 展 来 看 ， 计 算 机 广泛 应 用 到 信息 管理 领域 时 ， 每 个 应 用 都 是 作为 独立 系统 来 实现 
的 ， 各 有 一 套 自 己 的 数据 。 工 资 用 工资 单 文 件 处 理 ， 人 事 部 门 有 自己 的 职工 记录 ， 库 存 通过 库 
仓 文件 来 管理 。 这 就 意味 着 ， 许 多 只 是 一 个 部 门 需要 的 信息 在 整个 公司 里 会 被 复制 ， 而 许多 虽 
然 不 同 但 相互 关联 的 数据 项 却 又 存放 在 不 同 的 系统 中 。 在 这 种 背景 下 ， 数 据 库 系统 脱颖而出 ， 
它 作 为 一 种 信息 集成 的 手段 ， 通 过 特定 的 组 织 来 存放 和 维护 数据 〈 见 图 9-1)。 利 用 这 样 一 个 系 
统 ， 可 以 根据 相同 的 销售 数据 来 确定 进货 订单 ， 生 成 市 场 变化 趋势 的 报告 ， 指 导 广 告发 放 ， 并 
给 最 想 购买 此 种 产品 的 客户 提供 相应 的 产品 发 布 信息 ， 使 得 销售 团队 取得 更 好 的 业绩 。 

这 样 的 信息 集成 池 提供 了 有 价值 的 资源 ， 通 过 它 可 以 做 出 管理 决策 ， 假 定 能 通过 有 意义 的 
万 陈 来 获取 这 些 有 效 信息 。 反 之 ， 数 据 库 的 研究 聚焦 于 开发 技术 ， 通 过 它 数 据 库 中 的 信息 能 够 
提供 给 决策 过 程 。 在 此 方面 已 经 取得 了 很 大 进展 。 如 今 ， 数 据 库 技术 与 数据 挖掘 技术 相 结合 ， 
己 成 为 一 种 重要 的 管理 工具 ， 它 允许 组 织 的 管理 层 从 涵盖 组 织 和 其 环境 的 各 个 方面 的 大 量 数据 
中 提取 出 相应 的 信息 。 
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而 且 ， 数 据 库 系 统 已 经 成 为 六 撑 万 维 网 中 许多 更 为 流行 的 网 站 的 基础 技术 。 站 点 的 基础 主 
种 《如 Google、eBey 和 Amazon) 是 提供 客户 与 数据 库 间 的 接口 。 为 了 啊 应 客户 的 请 求 ， 服 务 器 
查询 数据 库 ， 把 结果 组 织 成 网 页 的 形式 ， 并 把 网 页 发 送 给 客户 。 这 样 的 网 站 接口 已 经 被 推广 ，“ ”1419 
成 为 数据 库 技术 的 一 个 新 角色 ， 其 中 数据 库 不 绸 是 存储 公司 记录 的 一 种 手段 ， 而 是 公司 的 产品 。 
实际 上 ， 通 过 结合 数据 库 技术 和 网 站 接口 ， 因 特 网 已 经 成 为 主要 的 全 球 信 息 源 。 


各 服部 财务 部 人 事 部 采购 部 市 场 部 


市 场 部 


人 事 部 


人 b) 面向 数据 库 的 信息 系统 
图 91 文件 与 数据 库 结构 的 比较 


9.1.2 ”模式 的 作用 


数据 库 技 术 的 迅速 发 展 有 一 个 缺点 ， 即 潜在 的 敏感 数据 被 未 授权 的 人 访问 。 某 人 在 公司 网 
站 上 下 了 一 份 订 单 ， 但 他 不 应 该 有 访问 公司 财务 数据 的 权限 ， 类 似 地 ， 公 司 福利 部 门 的 员工 有 
权 访 问 公司 员工 记录 ， 但 不 应 该 有 权 访 问 公 司 的 库存 或 销售 记录 。 因 此 ， 对 数据 库 中 信息 的 访 
问 控制 能 力 与 共享 它 的 能 力 同 等 重要 。 

为 了 让 不 同 的 用 户 访问 数据 库 中 不 同 的 信息 , 通常 数据 库 系 统 都 依赖 所 谓 的 模式 和 子 模式 。 
模式 〈schema) 是 整个 数据 库 结构 的 一 个 描述 ， 数 据 库 软件 用 它 来 维护 数据 库 。 子 模式 
《subschema) 只 是 与 特定 用 户 需 求 相关 的 那 部 分 数据 库 的 一 个 描述 。 例 如 ， 一 个 大 学 数据 库 的 
模式 应 当 说 明 ， 每 个 学 生 记录 包含 的 条 目 除了 学 习 成 绩 外 ， 还 有 现 阶段 的 联系 地 址 、 电 话 ， 还 
要 说 明 每 个 学 生 的 记录 要 与 其 指导 教师 的 记录 相 链接 。 同 样 ,每 个 教师 的 记录 要 包含 个 人 地 址 、 
工作 经 历 等 。 基 于 这 样 一 个 模式 ， 要 维持 一 个 链接 系统 ， 最 终 使 得 学 生 的 信息 与 教师 的 工作 经 
历 相 关联 。 
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为 了 使 大 学 的 注册 会 员 不 能 利用 这 种 链接 关系 来 访问 教师 的 专 有 信息 ， 就 必须 限制 注册 会 
员 只 能 访问 数据 库 的 子 模式 。 这 种 子 模式 中 ， 对 教师 记录 的 描述 并 不 包括 其 工作 经 历 。 在 这 种 
子 模式 下 ,注册 会 员 可 以 找到 某 个 教师 是 某 个 学 生 的 导师 ， 但 得 不 到 该 教师 的 其 他 信息 。 相 反 ，， 
对 财务 部 的 子 模 式 而 言 ， 它 需要 提供 每 个 教师 的 工作 经 历 , 但 不 包括 学 生 与 导师 间 的 链接 关系 。 
这 样 ， 财 务 部 可 以 修改 教师 的 工资 ， 却 不 能 获得 该 教师 指导 的 学 生 名 单 。 


9.1.3 ”数据 库 管理 系统 


一 个 典型 的 数据 库 应 用 涉及 多 个 软件 层 ， 我 们 将 其 分 组 成 两 个 主要 的 层 ， 即 应 用 层 和 数据 库 
管理 层 〈 见 图 9-2)。 应 用 软件 处 理 数据 库 与 用 户 〈 通 常 是 人 ， 有 时 也 可 能 是 另 一 种 软件 ) 间 的 通 
信 ， 这 可 能 很 复杂 ， 用 户 通过 网 站 访问 数据 库 的 应 用 就 是 其 中 一 个 例子 。 在 这 种 情况 下 ， 整 个 
应 用 层 包 括 遍及 因特网 的 客户 端 和 使 用 数据 库 满 足 客户 端 请 求 的 服务 器 端 。 


的 
用 户 庶 用 软件 ee 区 


从 应 用 角度 从 数据 库 模型 的 从 实际 组 织 的 
看 到 的 数据 库 和 角度 看 到 的 数据 库 ”角度 看 到 的 数据 库 


图 9-2 ”一 个 数据 库 实现 的 概念 性 层次 


注意 ， 应 用 软件 并 不 直接 操纵 数据 库 ， 对 数据 库 的 实际 操纵 由 数据 库 管 理 系 统 (DBMS) 
的 软件 层 来 完成 。 一 旦 应 用 软件 确定 了 用 户 请 求 的 活动 ， 它 就 利用 DBMS 作 为 抽象 工具 来 得 到 
所 需 的 结果 。 如 采用 户 要 求 增加 或 删除 数据 ， 就 由 DBMS 实 际 更 改 数据 库 。 如 果 用 户 请 求 检索 
信息 ， 就 由 DBMS 实 际 完成 所 要 求 的 信息 搜索 。 

应 用 软件 与 DBMS 分 离 有 几 个 好 处 。 一 个 好 处 就 是 允许 构建 和 使 用 抽象 工具 ， 在 软件 设计 
中 我 们 已 反复 看 到 这 个 重要 的 简化 工作 的 概念 。 如 果 数 据 库 实际 是 如 何 存放 数据 的 这 样 一 个 细 
节 被 DBMS 所 屏 项 ， 那 么 应 用 软件 的 设计 就 可 以 大 大 简化 了 。 举 个 例子 说 ， 一 个 精心 设计 的 
DBMS， 应 用 软件 无 需 考 虑 数据 库 到 底 是 存放 在 单 台 机 器 里 ， 还 是 像 分 布 式 数据 库 〈distributed 
database) 那样 ， 分 散 存 放 在 一 个 网 络 中 的 许多 机 器 里 。 取 而 代 之 的 是 ，DBMS 多 许 应 用 软件 直 
接 访问 数据 库 而 不 关心 数据 具体 存放 的 地 方 ， 通 过 这 种 方式 ，DBMS 很 好 地 处 理 这 些 问题 。 


分 布 式 数 据 库 


随 着 网 络 能 力 的 提高 ， 促 进 了 分 布 式 数据 库 的 发 展 ， 其 包含 的 数据 都 分 驻 留 在 不 同 的 机 
药 里 。 例 如 ， 一 个 跨国 公司 可 以 将 其 地 方 公司 的 员工 记录 在 本 地 进行 存储 和 维护 ， 然 后 通过 
网 络 链接 这 些 记 录 ， 并 创建 单个 的 分 布 式 数 据 库 。 

分 布 陈 数据 库 包含 的 数据 可 以 是 碎片 数据 ， 也 可 以 是 数据 的 副本 。 前 面 提 到 的 员工 记录 
的 例 于 就 属 第 一 种 情况 ， 即 数据 库 的 不 同 片段 看 放 在 不 同 的 地 方 ; 而 第 二 种 情况 中 ， 丰 同 的 
地 方 存放 有 数据 库 同 一 部 分 的 几 个 副本 ， 这 种 副本 的 存在 可 以 减少 信息 的 获取 时 间 。 两 种 情 
况 邦 造成 了 更 传统 的 集中 式 数据 库 所 没有 的 问题 ， 即 如 何 掩饰 这 种 数据 库 的 分 布 式 特性 ， 使 
它 像 一 个 连贯 的 系统 那样 工作 ? 如 何 保证 数据 库 更 新 时 ， 数 据 库 中 的 各 个 副本 仍 保持 一 致 ? 
所 以 ， 分 布 式 数据 库 是 当前 的 一 个 研究 领域 。 


应 用 软件 与 DBMS 分 离 的 第 二 个 好 处 就 是 ， 这 样 的 结构 提供 了 对 数据 库 访问 进行 控制 的 一 
种 手段 。 因 为 这 里 规定 是 由 DBMS 执 行 对 数据 库 的 所 有 访问 ， 所 以 DBMS 就 能 实施 由 不 同 子 模 
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式 确定 的 限制 。 具体 来 说 ， 对 内 部 的 请 求 ，DBMS 能 采用 整个 数据 库 模 式 ， 而 对 各 用 户 使 用 的 
应 用 软件 中 提出 的 请 求 ， 则 将 其 限制 在 该 用 户 子 模 式 描 述 的 范围 内 。 

把 用 户 界 面 与 实际 数据 库 操 作 分 离 成 两 个 不 同 的 软件 层 ， 还 有 另 一 个 原因 ， 就 是 为 了 获得 
数据 独立 性 (data independence)， 即 改变 数据 库 组 织 本 身 而 不 改变 应 用 软件 的 能 力 。 例 如 ， 人 
事 部 需要 在 员工 记录 中 增加 一 个 字段 ， 说 明 该 员工 是 否 参 加 了 本 公司 新 的 健康 保险 计划 。 如 果 
是 由 应 用 软件 来 直接 处 理 数 据 库 ， 一 个 数据 格式 的 变更 就 要 求 涉 及 该 数据 库 的 所 有 应 用 程序 都 
要 修改 。 这 样 一 来 ， 原 本 只 有 人 事 部 需要 的 改动 ， 导 致 了 要 修改 工资 计算 程序 和 为 公司 业务 通 
信和 服务 的 邮政 标签 打印 程序 等 。 

应 用 软件 与 DBMS 的 分 离 就 避 饮 了 这 种 重新 编程 的 需要 。 为 了 实现 由 某 个 用 户 提 出 的 对 数 
据 库 做 一 个 修改 的 要 求 ， 需 要 改变 的 只 是 总 体 模 式 ， 以 及 涉及 这 个 变更 的 那些 用 户 的 子 模式 ; 
其 他 所 有 用 户 的 子 模式 都 保持 不 变 。 因此， 基于 没有 改变 的 子 模式 的 应 用 程序 ， 也 不 必修 改 。 


9.1.4 数据 库 模型 


我 们 已 多 次 看 到 如 何 用 抽象 来 隐藏 内 部 的 复杂 性 。 数据 库 管理 系统 给 出 了 另外 一 个 例子 。 
该 例子 隐藏 了 数据 库 内 部 结构 的 复杂 性 ， 使 得 数据 库 的 用 户 认 为 在 数据 库 中 会 以 更 为 有 效 的 格 
式 来 组 织 和 存储 信息 。 上 有 具体 来 说 ，DBMS 包 舍 许 多 例 程 ， 把 接 数据 库 的 概念 视图 表达 的 命令 ， 
转换 为 实际 数据 存储 系统 所 要 求 的 操作 。 这 种 数据 库 的 概念 视图 就 称 之 为 数据 库 模 型 (database 
model) 。 

接 下 来 的 几 节 将 讨论 关系 数据 库 模 型 和 面向 对 象 数据 库 模 型 。 在 关系 数据 库 模 型 的 情况 下 ， 


数据 库 的 概念 视图 是 一 组 由 行 和 列 组 成 的 表格 。 例 如 ， 关 于 公司 员工 的 信息 可 以 看 成 这 样 的 一 


个 表格 ， 即 每 行 表示 一 名 员工 ， 各 列 分 别 表示 姓名 、 地 址 、 员 工 代 号 等 。 这 样 ， ee 
一 些 例 程 ， 即 使 在 实际 信息 并 没有 按 行列 存放 的 情况 下 ， Re 
中 选取 某 些 项 ， 或 者 输出 在 工资 列 中 找到 的 金额 范围 。 

这 上 绎 例 程 构成 了 应 用 软件 用 来 访问 数据 库 的 抽象 工具 。 更 精确 地 说 ， 通常 应 用 软件 用 一 各 
通用 程序 设计 语言 《这 些 在 第 6 章 讨 论 过 ) 来 编号。 这些 语言 为 算法 的 表达 提供 了 基本 的 元 素 ， 
但 缺少 操纵 数据 库 的 指令 。 然 而 ， 用 这 些 语 言 编写 的 程序 可 以 把 DBMS 提 供 的 例 程 作为 预先 编 
好 的 子 例 程 来 使 用 ， 这 实际 上 扩充 了 该 语言 的 能 力 ， 从 而 支持 了 数据 库 的 概念 模型 。 

寻找 更 好 的 数据 库 模型 是 一 个 正在 进行 的 工作 ， 其 目标 就 是 希望 找到 的 模型 能 够 容易 地 把 
复杂 的 数据 库 系统 概念 化 ， 能 够 以 简明 的 方式 表达 对 信息 的 请 求 ， 以 及 能 够 产生 有 效 的 数据 库 
常理 系 统 。 


问题 与 练习 

1. 在 一 个 生产 厂 中 确定 两 个 部 门 ， 说 明 它 们 对 间 一 个 或 者 类 似 的 库存 信息 会 有 不 同 的 用 途 。 然 所 ， 济 
明 两 个 部 门 的 子 模式 竺 样 不 同 。 

2. -数据 库 模 型 的 目标 是 什么 ? 

3. 概述 应 用 软件 和 DBMS 的 作用 。 


1 1 着 靖 下 | 国 LEFLLE Ia 
9.2 天 系 模 型 
一 一 - 


本 站 将 更 详细 讨论 关系 数据 库 模 型 。 这 种 模型 描绘 的 是 ， 用 矩形 表格 存放 数据 ， 称 之 为 关 
系 (relation )， 这 关 似 于 电子 制 表 程 序 显 示 信 息 的 格式 。 例如 ， 在 关系 模型 中 ， 一 个 公司 员工 的 
信息 融 表 示 为 图 9-3 所 示 的 关系 。 
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d423 


276 第 9 章 数据 库 系 统 


Empjid name Address SSN 
”25 兴 15 Joe 上 . 如 aker 33 败 Dwhere 后 t， 11122333 
| 34Y70 Cheryl H. Clark | 563 Downtownm Ave， 999009999 | 

23Y -3 避 . Jerry Smrmith 1555 Circle Dr 1110905555  ， 

本 达 融 


人 
| 
图 9-3 包含 员工 信息 的 一 个 关系 


关系 中 的 一 行 称 为 一 个 元 组 (tuple) (有 人 读 作 “TOO-pul”， 也 有 人 读 作 “TU-pul”)。 在 图 
9-3 所 示 的 关系 中 ， 元 组 由 某 个 特定 员工 的 信息 组 成 。 内 为 每 列 描述 的 是 对 应 的 元 组 所 表示 的 实 
体 的 一 些 特征 或 属性 ， 所 以 关系 中 的 列 称 为 属性 〈attribute )。 


9.2.1 关系 设计 中 的 问题 


妈 填 关系 数据 库 的 关键 步骤 是 设计 构成 这 个 数据 库 的 关系 。 尽管 这 个 工作 看 上 去 很 简单 ， 
但 对 于 粗心 的 设计 者 来 说 ， 仍 有 不 少 难以 捉摸 的 陷阱 。 

侈 定 除了 图 9-3 中 关系 所 包含 的 那些 信息 之 外 ， 我 们 还 想 要 添加 员工 工作 的 信息 。 这 里 需要 
为 每 个 员工 添加 一 个 工作 经 历 ， 包 括 如 下 一 些 属 性 ， 如 职务 〈 秘 书 、 办 公 室 经 理 .， 楼 层 主 管 )、 
职务 代码 〈 每 种 职务 唯一 )、 与 该 职务 有 关 的 技能 代码 、 该 职务 所 在 部 门 ， 以 及 该 员工 任职 的 开 
始 日 期 和 终止 日 期 〔 如 果 员 工 仍 任 现职 ， 则 终止 日 期 用 + 号 表示 ) 等 。 

解决 这 个 问题 的 一 种 方法 就 是 扩展 图 9-3 所 示 的 关系 ， 在 表格 中 加 进 这 些 属性 列 ， 如 图 9-4 
万 未 。 然而， 仔细 检查 这 个 结果 会 发 现 一 些 问题 。 问 题 之 一 是 ， 信 息 的 元 余 导致 了 效率 低下 。 
这 个 关系 中 不 再 是 每 个 员工 对 应 一 个 元 组 ， 而 是 每 次 职务 指派 就 对 应 一 个 元 组 。 如 果 一 个 员工 
在 会 司 里 历任 好 几 个 职务 ， 那么 新 关系 中 的 几 个 元 组 就 会 包含 该 员工 的 相同 信息 〔〈 姓 名 、 地 址 、 
员工 代号 及 社会 保险 号 )。 例 如 ， 因 为 Baker 和 Smith 担 任 过 一 个 以 上 的 职务 ， 所 以 有 关 他 们 的 个 
人 信息 就 会 有 重复 。 还 有 ， 当 某 个 特定 的 职务 由 几 个 员工 担任 过 ， 那么 与 此 职务 相关 的 部 门 及 
相应 的 技能 代码 也 会 在 指定 职务 的 每 个 元 组 中 重复 。 例 如 ， 因为 楼 层 经 理 有 一 个 以 上 的 员工 担 
任 过 ， 所 以 这 个 职务 的 描述 就 会 重复 。 

对 于 这 样 一 种 扩展 的 关系 ， 如 果 考 虑 从 数据 库 中 删除 信息 的 话 ， 会 引起 另外 一 个 更 为 严重 
的 问题 。 例 如 ， 假 定 只 有 Joe E. Baker 是 唯一 一 个 拥有 D7 这 个 职务 代码 的 员工 ， 如 果 他 离开 公告 
了 ， 井 从 图 9-4 表 示 的 数据 库 中 删除 ， 那 么 ， 有 关 D7 的 职务 信息 就 会 斑 失 ， 因为 包含 D7 职 务 需 
要 K2 技 能 级 这 个 事实 的 元 组 只 有 与 Joe E. Baker 有 关 的 那个 元 组 。 
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图 9-4 包含 元 余 的 关系 
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PC 机 的 数据 库 系 统 


PC 机 已 经 应 用 于 广泛 的 领域 ， 从 简单 到 复杂 。 在 一 些 基本 的 数据 库 应 用 中 ， 像 存放 圣诞 
卡片 清单 ， 或 者 保存 一 场 保龄球 比赛 的 记录 等 ， 因 为 仅仅 是 要 求 能 对 数据 进行 存储 、 打 印 和 
排序 这 样 的 操作 ， 所 以 常常 只 需要 用 电子 表格 系统 来 代替 数据 库 软 件 就 行 了 ， 然 而 ， PC 机 市 
场 上 还 是 有 许多 数据 库 系统 ， 例 如 微软 公司 的 Access 数 据 库 ， 这 是 9.2 节 所 描述 过 的 一 个 完整 
的 关系 数据 库 ， 也 是 图 形 和 报告 生成 软件 。Access 向 我 们 展示 了 一 个 很 好 的 ， 如 何 运 用 区 中 
提 到 的 原则 来 构建 今天 PC 机 市 场 上 流行 的 一 个 支柱 性 的 产品 的 例子 . 


你 也 许 会 认为 ， 能 做 到 只 删除 元 组 中 一 部 分 信息 ， 就 可 以 解决 这 个 问题 ， 但 是 这 又 会 引起 
新 的 膝 烦 。 比 如 ， 有 关 F5 职 务 的 信息 是 留存 在 一 个 部 分 的 元 组 中 ， 还 是 留存 在 关系 中 其 他 什 委 
地 方 ? 而 且 ， 这 种 利用 部 分 元 组 的 想法 正好 说 明了 该 数据 库 的 设计 还 能 够 改进 。 
所 有 这 些 问 题 产 生 的 原因 就 在 于 我 们 在 一 个 单一 的 关系 里 融 进 了 多 个 概念 。 图 9-4 中 的 扩展 
关系 包含 了 员工 的 直接 信息 〈 姓 名 、 员 工 代 号 、 地 址 、 社 会 保险 号 )， 有 关公 可 可 用 职务 的 信息 
(职务 代号 、 职 务 、 部 门 、 技 能 代号 )， 以 及 有 关 员 工 和 职务 间 关 系 的 信息 《开始 日 期 、 终 让 日 
贿 )。 基 于 以 上 的 分 析 ， 我 们 可 以 用 这 样 的 一 种 方式 来 解决 问题 ， 即 用 3 个 关系 来 重新 设计 这 -- 
系统 ， 每 个 关系 对 应 前 面 一 个 问题 。 我 们 可 以 保留 图 9-3 中 所 示 的 那个 原始 关系 〈 现 在 我 们 称 它 
为 BMPLOYEE 关 系 )， 再 插入 称 为 JOB 和 asSsIGNMENT 的 两 个 新 关系 ， 就 产生 了 如 图 9-5 所 示 的 数 
据 库 。 


EMPLOYEE 关系 
Empl ld Marme 入村 村 resS SSN 


Joe E., Baker 33 Nowhera St， 111223333 

Cheryl H, Clark 563 Dowrrtown Ave， 99 

6. Jerry Srmmith 1555 Lircle Dr. 111005555 
咕 量 各 





JOB 天 系 
Job | Job Title Skill Code Dept 


Secretary Personmnmael 
SeGcretary Aceounting 
| Floor rmanager 包 蛋 |eS 
性 大 大 


二 
三 





ASSIGNMENT 关 系 
Ermpl | Job 人 Start Date Terrmn Date 
号 -1- 1 与 恒 名 


10-1-2002 
5S-1-2001 


图 9-5 ”由 三 个 关系 组 成 的 员工 数据 库 426 





这 样 数据 库 就 由 3 个 关系 组 成 ， 即 EMPLOYEE 关 系 包 含有 关 员 工 的 信息 ， JOB 关系 包含 有 关 
职务 的 信息 ，aASsSIGNMENT 关 系 包 含有 关 职 务 经 历 的 信息 。 其 他 的 信息 则 障 售 在 不 同 关系 信息 
的 组 合 中 。 例 如 ， 如 果 知 道 一 个 员工 的 代号 〈 也 就 是 员工 的 ID 号 》， 就 可 以 先 用 &ASSIGNMENT 关 


278 “第 9 章 数据 库 系统 


系 找到 该 员工 任职 过 的 所 有 职务 ， 再 用 JOB 关系 找到 与 这 些 职务 有 关 的 部 门 《( 见 图 9-6)， 这 样 就 
可 以 找到 这 个 员工 任职 过 的 部 门 。 通过 这 样 一 些 步骤 ， 任 何 原 先 可 以 从 单一 的 大 型 关系 里 面 获 
得 的 信息 ， 现 在 都 能 从 3 个 较 小 的 关系 中 获得 ， 并 且 不 会 出 现 前 面 提 到 的 那些 问题 。 
EMPLOYEE 共和 
Ermm 户 | | Narme 和 dd 本 resSs SS 


Joe 上 . Baker 33 Mowhere St， 111223333 
Cheryl H. Clark 563 Downmtown Ave. 999009999 
扣 . Jerry Smith 1555 Circle Dr 111005555 





JOB 关系 
Job |d JobTitle Skill Code Dept 
-25 一 一 Secretary T5 Personneil 包 侣 在 
-26 之 Secretary T6 Accounting -人 事 部 
F5 Floor manager FM3 Sales 和 财 务 部 
三 春 ] 量 
大 各 大 三 
各 1 二 本 醒 
ASSIGNMENT 关系 
Emrmpl ld Job d Start Date Terrm at 
员工 23Y34 | 23Y34 L___ 本 25X 3.1-1999 4-30-2001 
的 职务 “|- 34Y70 F5 10-1-2002 ， 
| 23Y34 ,S26Z 5-1-2001 
各 者 大 性 
各 三 和 
帮 重 


图 9-6 ”查找 员工 23Y34 工 作 过 的 部 门 


42 但 是 ， 把 信息 划分 到 不 同 的 关系 中 ， 并 不 总 是 像 上 面 提 到 的 例子 那样 顺利 。 例 如 ， 在 图 9-7 
中 ， 原 来 的 关系 有 Emp1IQ〈 员 工 代 号 )、JobTitle (职务 ) 及 Dept 〈 部 门 ) 3 个 属性 ， 而 提议 
的 分 解 是 分 成 两 个 关系 ， 将 两 者 进行 比较 。 乍 看 起 来 ， 双 关系 系统 与 单 关 系 系 统 好 像 包 含 相同 
的 信息 ， 但 事实 并 非 如 此 。 比 如 ， 要 查找 某 员 工 工 作 过 的 部 门 ， 这 在 单 关 系 系 统 中 很 容易 ， 只 
需 查 找 包 含 该 员工 代号 的 那个 元 组 ， 取 出 相应 的 部 门 即 可 。 然 而 ， 在 双关 系 系统 中 ， 所 要 的 信 
县 未 必 存 在 。 我 们 可 以 找到 该 员工 的 职务 及 具有 这 个 职务 的 一 个 部 门 ， 但 这 并 不 一 定 意味 着 该 
员工 区 在 这 个 部 门 工 作 ， 因 为 几 个 部 门 可 以 有 同样 的 职务 。 


Empl Id Job Title Dept 


包 售 员 工 、 职 务 及 
部 门 的 原始 的 关系 


Ermpl |d 有 AN Dept 
提议 的 分 解 | 


图 9-7 ”关系 和 提议 的 分 解 


9.2 关系 模型 279 
一 - >- 大 外 候 宇 279 


于 是 ， 我 们 可 以 看 出 ， 把 一 个 关系 分 解 成 儿 个 比较 小 的 关系 时 ， 信息 有 时 会 于 失 ， 有 时 不 
会 斑 失 ， 后 者 称 之 为 无 损 分 解 〈lossless decomposition， 或 nonioss decomposition)。 对 这 种 关系 
特性 的 研究 是 一 个 重要 课题 ， 其 目标 就 是 找 出 会 在 数据 库 设 计 中 引起 问题 的 一 些 关 系 特性 ， 并 
找到 重新 组 织 那 些 关 系 的 方法 来 消除 这 些 出 问题 的 特性 。 


3.<.< 关系 运算 


一 旦 我 们 对 数据 是 如 何 按照 关系 模型 来 组 织 的 有 了 基本 的 了 解 ， 接 下 来 的 工作 就 看 看 如 何 
从 由 关系 组 成 的 数据 库 中 提取 信息 。 我 们 可 以 先 考 察 要 对 关系 实施 的 某 些 操 作 。 

我 们 常常 会 从 一 个 关系 中 选取 某 些 元 组 。 比 如 说 ， 要 检索 某 个 员工 的 信息 ， 就 必须 从 
EMBPLOYEE 关 系 中 选取 包含 相应 “员工 代号 ”属性 值 的 元 组 ， 或 者 为 了 得 知 某 一 部 门 有 哪些 
职务 ， 就 必须 从 JoB 关 系 中 选取 具有 该 部 门 属性 的 元 组 。 这 样 选 取 的 结果 是 ， 从 父 关系 中 选 
取 的 元 组 构成 了 另 一 个 关系 。 从 一 个 特定 员工 信息 选 出 的 结果 产生 的 一 个 关系 ， 只 包含 从 
EMPLOYEE 关 系 获得 的 一 个 元 组 。 而 选 出 来 的 相应 某 个 部 门 的 元 组 可 能 产生 来 自 rzoB 关 系 的 
几 个 元 组 。 

简 而 言 之 ， 在 一 个 关系 上 想 要 实施 的 一 种 运算 就 是 要 选取 具有 某 些 特性 的 元 组 ， 并 把 这 些 
选 出 的 元 组 放 到 一 个 新 的 关系 中 。 为 了 表示 这 种 运算 ， 我 们 采用 下 面 的 语法 ; 


NEW ~ SELECT from EMPILOYEE where Empllad = "34Y70n 


此 语句 的 语义 是 :创建 一 个 名 为 NEw 的 新 关系 ， 它 包 含 从 EMPLOYEE 关 系 选 得 的 其 Emplrd 
属性 等 于 34Y70 的 那些 元 组 〈 本 例 中 应 该 只 有 一 个 元 组 )( 见 图 9-8)。 








ErmD1】 己 苛 aaimi 世 号 柯 可 斑马 己 喇 SSN 
re ee 一 一 一 
| 25XT5 | JoeE. Bake 33 Nowhere St 111223333 | 
| 34Y70 Chery| H， Clark 563 Downtown Ave 399009999 

中。 (3. Jerry 所 rmith 155 呈 5 人 relE 站 rr 111005555 

EMPLOYEE 关系 | 1734 ae 人 0 


有 羽 
务 重 时 
| 量 中 重 
EN “” 富 了 DLRBCT rom 也 MPLOYEE where EDII 一 二 了 机 Y7OE 


| 


ErmDp1 ] 可 自生 中 三 遇 品 品 世 写 安 


NEW 天 和 孙 ad4Y70 | Chneryl 村 . 尼 二 rrk 


2 
呈 和 3 和 Ownmtownm 矶 局 号 号 乌 们 各 号 乌 持 咎 








图 98 SELECT 运算 


SELECT 运算 是 从 一 个 关系 中 提取 行 ， 与 此 相反 ， EROJECT 运 复 则 是 提取 列 。 例 如 ， 假 定 


企 查 找 某 部 门 职务 时 ， 已 经 从 zoB 关 系 中 SELECT 得 到 与 该 部 门 相应 的 元 组 ， 并 把 这 些 关系 放 到 


一 个 叫 NEwW1 的 新 关系 中 。 我 们 查找 的 清单 是 这 个 新 关系 里 的 JobTitle 列 。 PROJECT 运 算 就 是 
提取 这 个 列 〈 或 者 必要 时 是 几 个 列 》， 并 把 结果 放 到 一 个 新 关系 中 。 这 个 运算 表示 为 
NEW2 EROJECT JobTit1le 上 Tom 区 蕊 WW1 


其 结果 是 创建 另 一 个 新 关系 〈 称 NEw2 )， 它 包含 从 NEW1 关 系 中 JobTitle 列 得 到 的 那些 值 所 构 
成 的 一 个 列 。 


写 
己 
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作为 PROJECT 运 算 的 另 一 个 例子 ， 语 名 
MRTI 一 BROJECT 机 Bime ， 六 加 癌 荆 所 局 司 训 ii 瑟 MEI YY 瑟 


可 以 用 来 获取 所 有 员工 的 姓名 和 地 址 的 清单 。 这 个 清单 是 新 创建 的 《有 两 列 的 ) 关系 ， 称 其 为 
MRIL 关 系 〔( 见 图 9-9)。 

另外 的 一 个 用 于 连接 关系 数据 库 的 运算 是 JOIN 运算 ， 它 用 来 把 原来 不 同 的 关系 组 合成 一 个 
关系 。 两 个 关系 给 合 产 生 一 个 新 关系 ， 而 新 关系 的 属性 则 由 原来 两 个 关系 的 属性 组 成 〈《 见 图 
9-10)。 这 些 属性 的 名 称 与 原先 关系 中 的 名 称 一 样 ， 只 是 每 个 都 加 上 了 原 关 系 的 前 组 〈 如 果 包 含 
属性 v 和 w 的 关系 &A 与 包含 关系 X、Y 及 2z 的 关系 B 相 结合 ， 那 么 结果 就 有 名 为 &.V、 有 .W、B.X、B.Y 
和 Ba.2z 的 5 个 属性 )。 这 种 草 名 约定 保证 了 新 关系 的 属性 只 有 了 唯一 的 名 称 ， 即 使 原先 的 几 个 关系 
中 有 相同 的 属性 名 称 也 没关系 。 








Erm 阳 全 闸 疝 生 忘 加 可 站 SS 的 
十 问 已 E， 轩 百 民 后 『 33 风 Dwhere 马 t， 1112233333 
CheryYl H, 已 导 上 563 Downtown 和 ve. 999009999 
G. Jerry Smmith 1555 它 ircle Dr 111005555 
EMPLOYEE 关 系 本 曙 硬 
MA ss PROJECT Name, Address from EMPLOOYEE 
Narmme Address 
吉本 忆 磋 ， 忆 下 本 于 风 DOwhere 号 1 
世人 让 FrY| HH 人 IarK 6 了 DGDwrmtawn 上 we， 
全 ,Jerry 所 rmith 1 555 龙 irele Dr 
WIIAIL 关系 本 硬 
图 9-9 PROJECT 运 算 
其 于 之 
和 W (5 | g 
< 4 | dd 他 
关系 A | t | 4 关系 B | 辣 | 济 : | 间 
| 
D | 起 t | 1 
He 
归 Ar 
通 项 


人 < 一 JOIN and 日 Where 六.WWV= 已 其 
让 
由. 由 
| 剖 之 之 的 :| 恒 
关系 性 t | 引 | 品 | 本 | 


| | | 
[tl|4141t| ff | 


图 9-10 JOIN 运算 
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新 关系 的 元 组 〈 行 ) 由 原来 两 个 关系 的 元 组 串 接 而 成 《再 见 图 9-10)。 哪 几 个 元 组 会 连接 成 
新 关系 的 元 组 取决 于 连接 (JOIN) 的 条 件 。 一 个 条 件 就 是 指定 的 属性 要 有 相同 值 。 事 实 上， 图 
9-10 表 示 的 就 是 这 种 情况 ， 它 演示 了 执行 语句 


一 可口 II 下 DG 卫 是 用 全 e 外. 何 三 瑟 . 鞭 


的 结果 。 在 这 个 例子 里 ， 关 系 &a 的 一 个 元 组 与 关系 B 的 一 个 元 组 串 接 ， 其 条 件 正 是 两 个 元 组 的 属 
性 w 和 X 值 相等 。 因 此 ， 关 系 &a 的 元 组 〈《p 2) 与 关系 B 的 元 组 (2, m, q) 的 串 接 出 现在 结果 中 ， 因 
为 第 一 个 元 组 中 的 w 属 性 的 值 等 于 第 二 个 元 组 中 X 属 性 的 值 。 另 一 方面 ， 在 最 后 的 关系 中 并 没有 
关系 R 的 元 组 〈np 2) 与 关系 B 的 元 组 〈5, g, p) 串 接 的 结果 ， 这 是 因为 这 些 元 组 在 属性 w 和 X 中 没 
有 相同 的 值 。 

看 男 一 个 例子 ， 图 9-11 表 示 执 行 语 名 


二 UOGIN 下 忆 站 间 再 衣 heTe 下 .网 < 百 . 其 


的 结果 。 注 意 ， 结 果 中 的 元 组 正 是 其 中 关系 A 中 的 属性 w 小 于 关系 B 中 的 属性 X 的 那些 元 组 。 


时 让 日 P 
2 | 修 志 自 
基 系 AA t 让 2 所 
D | 昌 t f 


4 一 JOIN A and 日 where AWV<B.X 


中 W 世茂 目 Y 苇 .Z 
有 | 人 | 恩 | 生 
过 5 
4 | 5 | 





关系 属 





| 
_ 


图 9-11 JOIN 运算 的 另外 一 个 例子 


现在 来 看 怎样 对 图 9-5 中 的 数据 库 用 JOIN 运算 来 获取 一 个 清单 , 这 个 清单 包括 所 有 员工 的 员 
工 代 号 及 每 个 员工 的 工作 部 门 。 首 先 看 到 ， 所 要 的 信息 分 散在 一 个 以 上 的 关系 中 ， 所 以 检索 信 
息 单 靠 SELECT 和 PROJECT 是 不 行 的。 实际 上 ， 我 们 所 需要 的 工具 是 语句 


NEWJL ~ JOIN ASSIGNMENMT ana JOB where RaSSIGNMEMNT .JobIa = JOB .JobIdad 


如 图 9-12 所 示 , 它 产生 了 一 个 关系 NEw1L。 依 据 这 个 关系 , 我 们 的 问题 就 能 得 到 解决 , 即 先 SELECT 
其 中 ASSIGNMENT .TermpDate 等 于 “*”( “*#?” 表 示 “ 员 工 还 在 任职 期 罗 的 那些 元 组 ， 然 后 在 
ASSIGNMENT . EmplIGa 和 JoB.Dept 属 性 上 进行 PROJECT 运 算 。 简 而 言 之 ,我 们 需要 的 信息 可 以 
从 图 9-5 中 历 示 的 数据 库 通过 执行 以 下 语句 来 获得 ; 


NEWJL ” JOIN ASSIGNMENT ana JOB where ASSTICNMENT .JobIda = JOB.JobIa 
NEW2 ~ SELECT Erom NEW1L where ASSICNMENT .TermDate 一 “二 
LIST < 生 BROJECT aSSIGNMEMNT . Enp1IQ,JOB.Dept from NEW2 


起 
1 
i 一 一 
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ASSIGNMENT 关系 JOB 关系 
ErmP| Id Job | 村 Start Date Term Date Job 1 串口 日 下 it 让 写 攻 ii 忆 吕 de Dept 
站 本 - T 一 一 - 广 一 一 一 一 
23Y34 必 -30-2001 | 号 2 日 关 Secretary | TB | 户 章 F 村 癌 丰 闪避 | 
了 4Y 70 之 全 Secretary T 咎 疡 CEOUmTE 
隔世] 三 = F5 FIOGr rmara 吕 Bf FRI3 全 蚂 | 瑟 S 
间 曾 重 外 | 硬 
硬 邓 轴 融 | 二 
| 
、 
N 
AS 1 
省 
NEW1JoIN ASSIGNMENT and JOB where ASSIGNMEMNT. Jobld = JOB. Jobld 
NEW1 关系 
起 号 号 | 丰 MRMERNT 页 号 导 | 局 关 IENT 矶 号 司 IGMENT 丽 号 号 |I 合 MIENT J 避 书 本 局 已 JJ 四 可 避 ) 折 
ErmEl |d 吉村 | 可 与 { 丰 计 中 着 t TearrmiDate JiGrt |d Jj 癌 怕 下 许 | 二 与 民 i 川 仿 吾 村 站 肌 洒 刘 


己 全 TS 站 帮手 外 | 
可 | 登 东 


SEX | Secretary TS 
FS5 Flcor rmanmager FM 各 
与 人 忆 驴 忆 Cret 才 Fy 了 各 请 CCounting 
本 竹 车 晤 
1 性 到 和 鲁 
画 副 唱 辽 


图 9-12 JOIN 运算 的 应 用 


3-1-1999 4-30-2001 
10-1-2001 
5-1-2001 

志 

















9.2.3 SQL 


介绍 了 基本 的 关系 运算 之 后 ， 接 下 来 要 考虑 的 是 数据 库 系统 的 总 体 结构 。 我 们 知道 ， 数 据 
库 实际 上 是 存放 在 海量 存储 系统 中 的 。 为 了 让 应 用 程序 员 免 于 对 这 种 系统 细节 的 关注 ， 所 以 要 
提供 数据 库 管理 系统 ， 使 应 用 软件 能 够 按照 数据 库 模型 〔 如 关系 模型 ) 来 编号。DBMS 接 受 模 
型 方式 的 命令 ， 并 把 这 些 命令 转换 为 与 实际 存储 结构 有 关 的 操作 。 这 种 转换 由 DBMS 提 供 的 一 
组 例 程 来 实现 ， 应 用 软件 将 它们 用 作 抽 和 象 工具 。 这 样 ， 基 于 关系 模型 的 DBMS 会 包括 能 够 完成 
SELECT、PROJECT 和 JOIN 运算 的 程序 ， 应 用 软件 可 以 调用 它们 。 通 过 这 样 的 方式 ， 编 写 应 用 
软件 殉 好 像 数据 库 真 的 是 存放 在 关系 模型 的 一 个 简单 表格 中 。 
今天 的 关系 数据 库 管理 系统 不 一 定 提供 执行 原始 形式 SELECT、PROJECT 及 JOIN 运算 的 例 
程 ， 而 是 提供 一 些 组 合 了 这 些 基本 步骤 的 例 程 。 其 中 的 一 个 例子 就 是 SQL (Stmctured Query 
Language， 结 构 化 查询 语言 )， 它 构成 了 绝 大 多 数 关 系数 据 库 查询 系统 的 主干 。 例 如 ，SQL 是 许 
多 数据 库 服务 器 采用 的 关系 数据 库 系统 MySQL ( 读 作 “My-S-Q 工 ”) 的 基础 语言 。 

SQL 流行 的 一 个 原因 是 美国 国家 标准 化 组 织 已 经 将 它 标准 化 了 ， 另 一 个 原因 是 它 起 初 是 由 
IBM 公 司 开发 和 发 布 的 ， 这 样 从 一 开始 它 就 定位 为 一 个 高 层次 产品 ， 因 而 获 益 良 多 。 本 节 将 解 
释 如 何 用 SQL 表达 关系 数据 库 的 查询 。 

虽然 看 起 来 用 SQL 表述 的 查询 好 像 是 以 命令 的 形式 来 完成 的 ， 但 本 质 上 它 是 一 种 陈述 性 的 
语句 。 应 当 把 一 条 SQL 语句 看 作 是 对 所 需要 信息 的 一 种 描述 ， 而 不 是 一 串 要 执行 的 操作 。 这 样 
的 意义 在 于 ，SQL 使 得 应 用 程序 员 不 必 为 开发 处 理 关 系 的 算法 而 花费 精力 ， 他 们 只 要 描述 所 需 
要 的 信息 就 可 以 了 。 

作为 SQL 语句 的 第 一 个 例子 ， 我 们 现在 来 考虑 上 面 提 到 的 那个 查询 例子 。 在 那个 例子 中 ， 
为 了 获取 所 有 员工 的 代号 及 其 所 在 部 门 而 开发 设计 了 一 个 3 步 的 处 理 过 程 。 而 在 SQL 中 ， 整 个 查 
询 过 程 用 下 面 这 样 一 条 语句 就 可 以 表示 ; 


Select BRmp1IG，Dept 
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一” > 六 示人 局 二 co2 


上 rom 下 SSTCNMENT ，JOB 
Where ASSIGNMENT ,JobIa = JOB,JobIad 
ar 员 SSIGNMENTE TermDate 三 二? 


从 此 例 可 以 看 到 ， 每 条 SQL 查询 语句 可 包含 3 条 子 句 ， 即 select 子 句 、 from 子 何 和 where 子 句 。 
粗略 地 说 ， 其 实 这 样 一 条 语句 就 是 请 求 如 下 几 个 操作 的 结果 ，from 子 句 中 列 出 的 所 有 关系 的 
JOIN 操作 , 然后 是 SELECT 操作 , 即 选择 出 满足 where 子 句 中 条 件 的 那些 元 组 ， 最 后 是 PROJECT 
操作 ， 即 在 select 子 句 中 列 出 的 那些 元 组 上 进行 PROJECT 运 算 。( 注 意 ， 因 为 SQL 语句 中 的 
select 子 名 确定 的 是 PROJECT 运 算 中 所 用 的 属性 ， 所 以 ， 术 语 有 -一些 颠 倒 )。 让 我 们 来 看 一 些 
简单 的 例子 。 

语句 

select Name，RAddress 

于 革 DOm 卫 MPTOOYEE 
产生 了 一 个 包含 在 BMPLOYEE 关 系 中 的 所 有 员工 姓名 以 及 地 址 的 清单 。 注 意 ， 这 保 估 天 一 小 
PROJECT 运 算 。 

语句 

select Ermp1IQ，Name，aAaaQress，SSNum 

rom 了 MPLOYEE 

Where Mame = Chetry1 再 .CILarK， 


产生 了 EMPLOYEE 关 系 中 与 Cheryl H, Clark 相 关 的 元 组 的 所 有 信息 。 这 其 实 是 一 个 SELECT 运算 。 
语句 
号 已 所 et ame ， 站 梧 虽 eSS 


toOm 忆 MPETOY 卫 已 
Where Name = “Cheryl H.C1LaTrK， 


产生 了 BMPLOYEE 关 系 中 Cheryl H. Clark 的 姓名 和 地 址 信息 。 这 是 一 个 SELECT 和 PROJECT 的 组 合 
运算 。 

语 铝 

select EMPLOYEE .Name,ASSIGNMENT .StartDate 

from EMPLOYEE,ASSIGNMEMNT 

WW 了 所 工 扬 刁 MELOYEB.,EmplLIa = RSSIGNMENT,Emplia 


产生 一 个 所 有 员工 姓名 及 其 开始 工作 日 期 的 清单 。 注 意 ， 这 是 如 下 几 个 操作 的 结果 :首先 对 
EMPLOYEE 和 ASSITGNMENT 两 个 关系 进行 JOIN 操作 ， 然 后 对 在 where 子 句 及 seleet 子 名 指定 的 
元 组 和 属性 进行 SELECT 操作 和 PROJECT 操 作 。 

最 后 ， 我 们 需要 指出 的 是 ，SQL 语 句 除了 可 以 完成 查询 功能 ， 还 可 以 定义 关系 的 结构 ， 创 
建 关 系 ， 以 及 修改 关系 的 内 容 。 例 如 ， 下 面 是 一 些 insert into、qaelete from 和 update 语 
句 的 例子 。 

语句 

工 也 记忆 T 七 守 交 七 口 及 MPTL OOYBR 

Values (人 42221205Sue ，Burt' 33 下 iT 七 .“，" 业 芋 如 11117) 


表示 在 EMPLOYEE 关 系 中 增加 给 定 值 的 元 组 ， 语 各 


司马 已 七 全 主 臣 让 mm 玉 风 尼 世 局 Y 忆 站 


和 


34 


十 = 
| 
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WW 有 ET ame = .JeTTY SmIL ET 
表示 从 EMPLOYEBE 关 系 中 把 与 G Jerry Smith 有 关 的 元 组 删除 掉 ， 而 语句 


已 疡 扣 二 七 和 让 眉 MELOYEEE 
号 已 七” 遇 章 癌 工 忆 呈 号 = 1】 工 812 区 昌 DeBn 下 VE 。， 


公用 电工 旺 ” 末 六 和 二 《林口 下 已 .马刀 其 所 三 


表示 修改 EMPLOYEE 关 系 中 与 Joe E.Baker 有 关 的 元 组 中 的 地 址 信息 。 


问题 与 练习 

1. 根据 图 #5 中 所 示 的 EMEPLOYEE、JOB 和 aSSITGNMENT 关 系 提供 的 部 分 信息 ， 回 答 下 列 问 题 ; 
a. 指出 谁 茎 是 财务 部 秘书 ， 又 具有 人 事 部 工作 的 经 历 ? 

b. 指出 谁 是 销售 部 的 楼 层 经 理 ? 
c，、G.Jerry Smi 由 现在 的 工作 职务 是 什么 ? 

,根据 图 %-5 所 示 的 BMPLOYEE、JOB 和 ASSTGNMENT 关 系 , 写 出 要 获取 一 份 人 事 部 的 所 有 职务 清单 所 需 
的 相关 操作 。 

. 根据 图 9-5 中 所 示 的 EMPLOYEE、JOB 和 asSSITGNMENT 关 系 , 写 出 要 获取 一 份 员工 姓名 及 其 工作 部 门 清 
单 所 需 的 相关 操作 。 

. 把 第 2 题 和 第 3 题 的 答案 转换 成 SQL 语句 。 

， 说明 关 系 模 型 是 如 何 提 供 数 据 独 立 性 的 ? 

. 锅 明 在 一 个 关系 数据 库 中 ， 不 同 的 关系 是 怎样 联系 在 一 起 的 ? 


sa 


Fi 


站 


全 于 


着 识 对 旬 数 据 庄 
另 一 种 数据 库 模 型 是 基于 面向 对 象 范 型 的 。 运 用 面向 对 象 方法 构建 的 数据 库 称 为 面向 对 象 
数据 库 〈object-oriented database)， 它 由 对 象 构 成 ， 对 象 之 间 通 过 相互 链接 来 反映 它们 之 间 的 联 


系 。 例 如 ，9.2 节 中 员工 数据 库 的 面向 对 天 

象 实现 可 以 包 例 3 个 类 【〔 对 铺 的 类 型 ): 交 
EMPLOYEE、JOB 和 RSSIGNMENT。EMPL- 一 一 
DOYEE 头 的 对 象 可 以 包含 Emp1Id、Name、 A] 攻 1 
address 上 及 SSNum 这 样 一 些 属 性 ，JOB EMPLOYEE 1 司 -JOB 
类 的 对 象 可 以 包含 JobIa、JobTit1le、 ee 本 ee 
Skillcode 及 Dept 这 些 属性 ， ASSICGCN- 忆 NE 


MENT 关 的 对 象 可 以 包含 startDate 及 0 / 
TermDate 这 些 属性 ， 区 四 


面向 对 象 数据 库 的 概念 表示 如 图 9-13 nn 
所 示 ， 其 中 不 同 对 象 间 的 链接 可 以 用 相关 < 
的 对 象 之 间 的 连 线 来 表示 。 如 果 我 们 注意 1/ 
到 EMPLOYEE 类 的 一 个 对 银 ， 可 以 看 出 它 NE 


与 ASSTGNMENT 类 的 一 组 对 象 关 联 ， 这 就 有 
表示 某 个 员工 任职 过 的 不 同 职务 。 同 样 网 9-13 面向 对 和 象 数据 库 中 对 象 间 的 关联 

ASSIGNMENT 类 的 每 个 对 象 都 与 JOB 类 一 个 对 象 相 关联 ， 那 么 这 就 表示 基 个 工作 与 其 指派 的 职务 相 
天。 上 所以， 只 要 治 着 表示 某 员 工 的 对 象 的 链接 进行 查找 ， 就 能 找到 该 员工 所 有 的 任职 情况 。 类 似 地 ， 
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可 以 通过 查找 表示 某 工作 的 对 象 的 链接 ， 来 得 到 从 事 过 该 工作 的 所 有 员工 的 名 单 。 

通常 ， 面 问 对 银 数 据 库 中 对 象 间 的 链接 是 由 DBMS 来 维护 的 ， 所 以 有 关 这 些 链 接 是 如 何 实现 
的 细节 ， 无 需 编 写 应 用 软件 的 程序 员 关 心 。 相 反 ， 当 向 数据 库 中 增加 新 对 象 时 ， 应 用 软件 只 要 指 
明 这 个 新 对 象 应 当 与 哪些 对 象 相 链接 就 可 以 了 。 然 后 由 DBMS 创 建 为 记录 这 些 关联 信息 所 需 的 链 
接 系 统 。 具 体 地 说 ，DBMS 会 以 类 似 于 链表 的 形式 ， 把 表示 某 员工 的 职务 的 对 象 链接 起 来 。 436 

面 癌 对象 的 DBMS 的 另 一 个 任务 就 是 要 为 其 托管 的 对 象 提供 永久 的 储存 室 间 ， 这 个 要 求 看 
起 来 显而易见 ， 但 它 与 处 理 对 象 的 常规 方式 有 着 本 质 的 不 同 。 通 常 ， 在 执行 一 个 面向 对 象 程 序 
时 ， 程 序 执行 期 间 创 建 的 对 象 在 程序 终止 时 就 会 被 斑 弃 。 从 这 个 意义 上 看 ， 可 以 认为 对 象 是 临 
时 的 。 但 是 ， 在 数据 库 中 创建 或 添加 的 对 象 ， 在 创建 它们 的 程序 终止 后 必须 保存 。 这 样 的 对 象 
称 为 是 持久 的 〈persistent) 对 象 。 所 以 ， 创 建 持久 对 象 与 创建 常规 对 象 有 很 大 不 同 。 

面向 对 象 数据 库 的 支持 者 提出 许多 论据 ， 来 说 明 为 什么 用 面向 对 象 方法 设计 的 数据 库 要 比 
用 关系 方法 设计 的 好 。 其 中 一 个 论据 是 说 ， 面 向 对 象 方法 使 整个 软件 系统 〈 应 用 软件 、DBMS 
和 数据 库 本 身 ) 用 同样 的 范 型 来 设计 。 这 与 以 往 为 开发 查询 关系 数据 库 的 应 用 软件 通常 是 采用 
命令 型 编程 语言 不 同 。 在 这 样 的 任务 中 ， 命 令 范 型 与 关系 范 型 之 间 的 冲突 是 不 可 避免 的 。 就 我 
们 学习 的 水 平面 言 ， 这 种 差别 是 很 小 的 ， 但 是 多 年 以 来 ， 这 种 差别 正 是 许多 软件 错误 的 根源 之 
所 在 。 即 使 以 现 有 的 知识 水 平 ， 我 们 也 能 够 理解 ， 面 向 对 象 数据 库 与 面向 对 象 应 用 程序 的 结合 
产生 了 一 种 同 构 的 、 遍 布 整个 系统 都 是 对 象 相互 间 通 信 的 景象 。 另 一 方面 ， 关 系数 据 库 与 命令 
型 应 用 程序 的 绪 合 ， 给 人 的 感觉 是 产生 了 两 种 本 质 上 不 同 的 组 织 企 图 寻找 共同 接口 的 景 银 。 

为 了 理解 面向 对 象 数据 库 相 对 于 关系 数据 库 的 另 一 个 优势 ， 这 里 我 们 先 来 看 一 个 关系 数据 
库 中 存储 员工 姓名 的 问题 。 如 果 把 全 名 存放 在 一 个 关系 的 单个 属性 中 ， 那 么 仅仅 是 关于 姓氏 的 
查询 就 比较 麻烦 了 。 然 而 ， 如 果 将 全 名 分 存 于 3 个 分 开 的 属性 ， 即 名 字 、 教 名 和 姓 ， 那 么 ， 在 处 
理 不 遵循 这 种 姓名 模式 的 人 员 时 ， 又 将 会 遇 到 难题 。 在 面向 对 象 数据 库 中 ， 这 些 问 题 就 可 以 隐 
藏 在 存储 员工 姓名 的 对 象 里 。 一 个 员工 的 姓名 可 以 存储 为 一 个 灵活 的 对 象 ， 它 能 以 不 同 的 格式 
输出 有 关 员 工 的 姓名 。 所 以 ， 从 这 些 对 象 外 部 看 ， 对 于 处 理 姓 氏 、 全 名 、 结 婚前 的 名 字 或 者 绰 
号 等 ， 都 是 一 样 的 简单 。 每 种 外 在 的 表现 形式 所 涉及 的 细节 都 会 被 封装 于 对 象 中 。 

这 种 把 不 同 的 数据 格式 进行 封装 的 能 力也 是 另 一 个 优点 。 在 关系 数据 库 中 ， 关 系 中 的 属性 
是 数据 库 从 头 至 尾 需 要 设计 的 一 部 分 ， 所 以 与 这 些 属 性 有 关 的 数据 类 型 将 遍及 整个 DBMS.。( 临 
时 储存 的 变量 必须 声明 为 适当 的 类 型 ， 并 且 必 须要 设计 出 处 理 不 同类 型 数据 的 过 程 .) 因此 ， 要 
在 关系 数据 库 中 扩充 一 个 新 类 型 的 属性 〈 音 频 或 视频 )， 就 很 可 能 会 遇 到 问题 。 具 体 地 说 ， 贯 穿 
数据 库 设 计 的 各 种 过 程 都 必须 进行 扩展 ， 用 以 包含 这 些 新 的 数据 类 型 。 然 而 ， 在 面向 对 象 设 计 
中 ， 用 来 取得 表示 员工 姓名 的 对 象 的 过 程 ， 同 样 也 可 用 来 取得 表示 一 段 影片 的 对 象 ， 这 是 因为 
类 型 的 差异 被 隐藏 在 所 涉及 的 对 象 里 。 因 此 , 面向 对 象 方法 显得 与 多 媒体 数据 库 的 构建 更 协调 ， 

而 这 个 特性 已 经 被 证 明 具 有 极 大 的 优势 。 

面 况 对 象 设 计 方 法 对 数据 库 设 计 而 言 ， 还 有 一 个 好 处 ， 就 是 它 有 存储 智能 对 象 的 潜力 而 不 
仅仅 只 是 数据 。 也 就 是 说 ， 对 象 能 够 包含 一 些 方法 ， 用 来 描述 它 应 如 何 响应 有 关 它 的 内 容 和 联 
系 的 消息 。 例如， 图 9-13 中 所 示 的 EMPLOYEE 类 的 每 个 对 象 都 能 够 包含 用 于 显示 和 更 新 这 个 对 象 
信息 的 方法 ， 也 有 显示 员工 工作 经 历 的 方法 ， 甚 至 还 可 能 有 用 于 更 改 员 工 职务 的 方法 。 同 样 ， 
JOB 类 的 每 个 对 象 都 可 以 有 用 于 显示 职务 属性 的 方法 ， 还 可 以 有 用 于 显示 任 过 此 职 的 员工 名 单 
的 方法 。 这 样 一 来 ， 为 了 查找 员工 的 工作 经 历 ， 就 没有 必要 再 去 编写 外 部 过 程 来 描述 如 何 获得 
这 些 信 息 ， 而 只 需要 去 查询 相应 的 员工 对 象 ， 就 能 显示 其 工作 经 历 了 。 如 果 构 建 的 数据 库 有 这 
梓 的 能 力 ， 即 它 的 组 成 部 分 能 够 智能 地 回应 查询 请 求 ， 这 上 比 传统 的 关系 数据 库 更 能 够 提供 --- 些 
令 人 兴奋 的 可 能 性 。 世 
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问题 与 练习 

1. 本 他 讨论 的 员工 数据 库 中 ，&ASSIGNMENT 类 的 一 个 对 象 的 实例 应 包含 哪些 方法 ? 
2， 什么 是 一 个 持久 对 急 ? 

3. 斌 确定 在 一 个 处 理 仓 库 货 存 的 面向 对 象 数据 库 中 ， 要 用 到 哪些 类 以 及 哪些 内 部 特征 ? 
4. 试 说 明 相 对 关系 数据 库 而 言 ， 面 向 对 象 数据 库 的 优越 性 。 


0 | 


9.4_ 维护 数 据 库 的 完整 性 


个 八 使 用 的 廉价 数据 库 管理 系统 是 相对 比较 简单 的 系统 。 它 们 大 致 有 一 个 单纯 的 目标 ， 即 让 
用 户 避 开 数 据 库 实现 的 技术 细节 。 用 这 类 系统 维护 的 数据 库 相 对 比较 小 ， 所 包含 的 信息 也 不 会 非 
季 重 要 ,信息 的 丢失 或 破坏 通常 只 会 带 来 不 便 ， 而 不 至 于 造成 灾难 性 的 后 果 。 当 问题 真 的 发 生 时 ， 
用 户 通 党 可 以 直接 改正 错误 项 ， 或 者 用 备份 重新 恢复 数据 库 ， 并 手工 做 些 必要 的 修改 ， 使 数据 库 
能 够 及 时 更 新 。 这 样 的 处 理 过 程 也 许 不 太 方便 ， 但 是 ， 为 避免 这 种 麻烦 所 花 的 代价 要 比 这 种 麻烦 
本 身 还 大 。 无 论 怎么 说 ， 这 种 麻烦 只 局 限于 少数 人 身上 ， 并 且 财 务 上 的 损失 通常 也 有 限 。 

人 然而， 就 大 型 的 、 多 用 户 的 商用 数据 库 系 统 来 说 ， 利 害 关系 就 大 得 多 。 数 据 出 错 或 于 失 的 
代价 会 十 分 巨大 ， 甚 至 会 带 来 毁灭 性 的 后 果 。 在 这 样 的 环境 下 ，DBMS 的 主要 作用 就 是 维护 数 
据 库 的 完整 性 ， 防 止 问题 的 发 生 ， 如 因 某 种 缘故 只 是 完成 了 部 分 操作 ， 或 因 朴 忽 不 同 操作 之 间 
相互 作用 ， 从 而 造成 数据 库 信息 的 出 错 等 问题 。 本 节 就 来 阐述 DBMS 的 这 种 作用 。 


9.4.1 提交 / 回 滚 协议 


单个 事务 ， 如 从 一 个 银行 账户 向 另 一 账户 的 转账 、 预 订 航 班 的 取消 、 学 生 的 大 学 课程 的 登 
记 ， 可 能 会 在 数据 库 层 次 上 有 多 个 步骤 。 例 如 ， 银 行 账户 间 的 转账 要 求 一 个 账户 的 余额 减少 ， 
同时 习 一 个 账户 的 余额 增加 。 在 这 些 步骤 之 间 ， 数 据 库 中 的 信息 可 能 会 不 一 致 。 事 实 上 ， 在 第 
一 个 账户 余额 已 减少 ， 而 另 一 个 账户 余额 尚未 增加 的 这 一 短暂 时 间 里 ， 资 金 有 可 能 会 不 见 。 类 
似 地 ， 当 为 一 个 乘客 重新 安排 航班 座位 时 ， 会 有 一 瞬间 这 个 乘客 没有 座位 ， 或 者 有 一 瞬间 乘客 
名 单 中 会 比 实 际 数 元 出 一 位 。 

在 大 型 数据 库 的 情况 下 ， 事 务 量 会 很 繁重 。 在 任意 一 个 瞬间 ， 数 据 库 极 有 可 能 处 于 某 个 事 
务 的 中 间 状 态 。 一 个 执行 事务 的 请 求 或 者 一 个 设备 的 故障 ， 很 可 能 会 发 生 在 数据 库 处 于 不 一 至 
状态 的 这 个 时 候 。 

首先 我 们 来 考虑 故障 问题 。DBMS 的 目标 就 是 要 保证 这 种 问题 不 会 把 数据 库 冻结 在 不 一 臻 
的 状态 。 为 了 做 到 这 一 点 ， 需 要 维护 一 个 用 来 记录 每 个 事务 活动 的 日 志文 件 ， 该 日 志文 件 通 党 
仓储 在 诸如 磁盘 这 类 非 易 失 性 的 存储 系统 中 。 一 个 事务 被 允许 更 改 数据 库 之 前 ， 要 执行 的 更 改 
先 被 记录 到 日 志文 件 中 。 这 样 ， 这 个 日 志文 件 就 包含 了 每 个 事务 活动 的 持久 性 记录 。 

把 一 个 事务 的 所 有 步骤 记录 进 日 志文 件 的 那个 点 ， 称 为 提交 点 (commit point)。 正 是 在 这 个 
所 上 ，DBMS 拥 有 在 必要 时 人 靠 自己 重建 事务 所 需要 的 信息 。 同 时 ， 在 这 个 点 上 ， DBMS 在 一 定 意 
义 上 为 事务 提供 了 保证 , 即 它 负责 确保 事务 活动 在 数据 库 中 得 到 反映 。 在 出 现 设备 故障 的 情况 下 ， 
DBMS 可 以 利用 其 日 志文 件 中 的 信息 ， 重 建 自 上 一 次 备份 以 来 已 经 完成 的 〈 提 交 的 ) 事务 。 

如 果 问 题 出 现在 事务 达到 其 提交 点 之 前 ， 那 么 DBMS 可 能 会 发 现 自己 不 能 完成 已 经 执行 了 
一 部 分 的 事务 。 这 种 情况 可 以 利用 日 志 回流 〈roll back) (也 称 为 撤销 ) 实际 上 已 被 事务 实施 的 
洁 动 。 例 如 ， 在 出 现 故障 的 情况 下 ，DBMS 可 以 通过 撤销 那些 在 故障 发 生 时 没有 完成 〈 或 称 为 
未 提 变 ) 的 事务 ， 从 而 恢复 原状 。 
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然而 ， 事 务 的 撤销 并 不 局 限于 设备 故障 恢复 的 处 理 。 它们 常常 也 是 DBMS 正 常 操作 的 一 部 分 。 
例如 ， 由 于 有 试图 访问 特权 信息 的 情况 发 生 ， 那 么 事务 可 能 在 完成 全 部 步骤 前 就 会 被 终止 。 或 者 
可 能 是 遇 到 死 锁 情况 ， 即 竞争 资源 的 几 个 事务 发 觉 自己 一 直 在 等 待 数据 ， 而 等 待 的 数据 正好 被 对 
方 使 用 。 在 这 些 情况 下 ，DBMS 能 够 利用 日 志 撤 销 事务 ， 从 而 避免 了 未 完成 的 事务 使 数据 库 出 错 。 

为 强调 DBMS 设 计 的 精妙 特性 ， 我 们 要 指出 ， 回 滚 过 程 中 隐藏 着 许多 微妙 的 问题 。 一 个 事务 
的 回 滚 可 能 会 影响 到 其 他 的 事务 已 用 过 的 数据 库 项 。 例 如 ， 正 被 回 滚 的 事务 可 能 已 经 更 新 了 一 个 
账户 余额 ， 而 另 一 个 事务 已 进行 的 活动 可 能 就 是 基于 这 个 更 新 的 值 。 这 就 意味 着 这 些 另 外 的 事务 
也 得 回 滚 ， 从 而 又 会 影响 到 别 的 事务 ， 结 果 就 产生 了 称 为 级 联 回 滚 〈cascading rollback) 的 问题 。 


9.4.2 ”锁定 


现在 我 们 来 考虑 这 样 一 个 问题 ， 即 一 个 正在 执行 的 事务 正 值 数据 库 因 另 一 事务 而 处 于 变迁 
状态 ， 这 种 情况 下 会 无 意 中 造 成 事务 间 的 相互 影响 ， 从 而 会 产生 错误 的 结果 。 例 如 ， 如 果 一 个 
事务 正 从 一 个 账户 转账 到 另 一 个 账户 ， 而 另 一 个 事务 试图 计算 银行 存款 总 额 ， 就 会 产生 错误 决 
算 问题 〈incorrect summary problem)。 依 据 转账 步骤 的 先后 次 序 ， 结 果 就 可 能 会 造成 存款 总 数 不 
在 太太 ， 网 是 太 小 。 男 一 个 可 能 出 现 的 问题 是 更 新 丢失 问题 〈lost update problem)。 举 例 来 说 ， 
有 两 个 事务 ， 每 个 事务 都 是 完成 从 同一 账户 扣除 金额 的 操作 。 如 果 一 个 事务 读 取 当 前 佘 额 时 ， 正 
值 必 一 个 事务 刚 读 取 过 余额 但 尚未 计算 好 新 余额 的 时 候 ， 于 是 这 两 个 事务 都 会 在 同一 个 初始 账号 
上 进行 扣除 操作 ， 这 样 一 来 ， 其 中 的 一 个 扣除 的 结果 将 不 会 反映 在 数据 库 中 。 

为 了 解决 这 样 的 问题 ，DBMS 可 以 强制 一 次 执行 一 个 整体 事务 来 处 理事 务 ， 即 每 个 新 的 事 
务 要 进行 排队 等 待 ， 直 到 它 前 面 的 事务 全 部 完成 后 才能 得 到 执行 。 但 是 事务 常常 要 花费 很 多 时 
间 来 等 待 海量 存储 操作 的 完成 。 这 里 可 以 采用 这 样 一 种 方式 来 解决 这 个 问题 ， 即 通过 事务 之 间 
的 区 又 执 行 ,可 以 实现 把 一 个 事务 等 待 的 时 间 分 配给 另 一 个 事务 ， 用 来 处 理 它 已 经 获得 的 数据 。 
大 多 数 大 型 数据 库 管 理 系统 都 有 一 个 调度 程序 来 协调 事务 间 的 分 时 ， 这 非常 像 多 道 程序 设计 操 
作 系 统 里 协调 进程 的 变 叉 处 理 〈 见 3.3 节 )。 

为 了 防止 错误 决 算 问题 和 更 新 丢失 问题 这 一 类 异常 情况 的 出 现 ， 这 些 调度 程序 都 包含 了 -- 
个 锁定 协议 〈locking protocol)， 该 协议 规定 ， 数 据 库 中 当前 正在 被 某 个 事务 使 用 的 项 目 都 要 加 
以 标记 。 这 些 标记 称 为 锁 , 已 标记 的 项 目 称 为 被 锁定 。 常见 的 有 两 种 类 型 的 锁 , 即 共 享 锁 (shared 
lock) 和 排 它 锁 (exclusive lock)， 它 们 分 别 对 应 于 事务 需要 访问 数据 的 的 两 种 访问 形式 ， 即 共 
享 访问 和 互 斥 访问 。 如 果 一 个 事务 不 会 改变 数据 项 ， 那 么 它 要 求 的 就 是 共享 访问 ， 这 就 意味 着 
允许 其 他 事务 看 到 该 数据 项 。 而 如 果 一 个 事务 会 改变 数据 项 ,那么 它 要 求 的 就 必须 是 互 斥 访问 ， 
这 融 意 味 看 ， 只 有 该 事务 才能 访问 该 数据 项 。 

在 锁定 协议 中 ， 每 次 一 个 事务 请 求 访问 数据 项 时 ， 它 还 必须 告诉 DBMS 要 求 访 问 的 类 型 . 
如 果 事 务 请 求 的 是 对 一 个 数据 项 的 共享 访问 ， 那 么 不 论 这 个 数据 项 是 否 用 共享 锁 锁 定 ， 这 个 访 
问 都 将 会 被 批准 ， 并 且 将 该 数据 项 用 共享 锁 进 行 标记 。 但 是 ， 如 果 被 请 求 的 数据 项 已 经 用 排 它 
锁 标 记 了 ， 那 么 别 的 访问 都 将 会 被 拒绝 。 如 果 事 务 对 数据 项 的 访问 请 求 是 互 斥 访问 ， 那 么 只 有 
在 这 个 数据 项 没有 被 锁定 的 情况 下 ， 请 求 才 能 被 批准 。 通 过 这 样 一 种 方式 ， 一 个 准备 改动 数据 
欧 的 事务 就 可 以 通过 获得 的 互 斥 访问 ， 来 防止 别 的 事务 对 该 数据 项 的 干预 。 反 之 ， 如 果 几 个 事 
务 都 不 会 改动 数据 项 ， 那 么 它们 就 能 够 对 这 个 数据 项 实现 共享 访问 。 当 然 ， 一 旦 事务 完成 了 对 
数据 项 的 访问 ， 那 么 它 就 会 通知 DBMS， 并 解除 相关 的 锁定 。 

妾 出现 事务 的 访问 请 求 被 拒绝 的 情况 时 ， 可 以 有 许多 不 同 的 算法 进行 处 理 。- 一 种 算法 就 是 
强制 事务 等 待 ， 直 至 所 请 求 的 项 可 用 为 止 ， 但 是 这 种 方法 容易 造成 死 锁 。 因 为 两 个 事务 要 求 对 
同样 的 两 个 数据 项 进行 互 斥 访问 的 时 候 ， 如 果 每 一 个 事务 都 获得 了 对 其 中 一 个 数据 项 的 互 斥 访 
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问 权限 ， 并 且 又 坚持 等 待 另 一 个 数据 项 ， 那 么 它们 就 会 出 现 阻塞 情况 。 为 了 避免 这 种 死 锁 的 发 
生 ， 有 些 数据 库 管 理 系统 会 让 较 早 的 事务 优先 处 理 。 也 就 是 说 ， 如 果 一 个 较 早 的 事务 有 要求 访问 
被 稍 后 的 事务 锁定 的 数据 项 时 ， 那 么 就 强制 那个 稍 后 的 事务 释放 其 所 有 的 数据 项 ， 而 它 的 活动 
都 会 被 撤销 《依据 日 志文 件 )。 于 是 ， 较 早 的 事务 就 获得 了 对 它 要 求 的 数据 项 的 访问 权限 ， 而 可 
后 的 事务 只 得 重新 开始 。 如 果 一 个 稍 后 的 事务 一 直 被 抢占 ， 那 么 随 着 过 程 的 进展 它 也 会 变 老 ， 
最 终 成 为 一 个 具有 较 高 优先 级 的 老 事务 。 这 个 协议 , 称 之 为 受伤 等 待 协议 人 《wound-wait protocol) 
( 老 的 事务 将 新 的 事务 挂 起 ， 而 新 的 事务 等 待 变 成 老 的 事务 )， 这 样 就 能 保证 每 个 事务 最 终 痢 能 
完成 它 的 任务 。 


问题 与 练习 

1. 说 明 事 务 到 达 了 它 的 提交 点 与 没 到 达 提 变 点 的 区 别 是 什么 ? 

DBMS 是 怎样 防止 大 量 的 级 联 回 冬 的 ? 

3. 假定 一 个 账户 初始 余额 是 400 美 元 。 有 两 个 事务 ， 一 个 事务 从 这 个 账户 中 支取 100 美 元 ， 另 一 个 事务 
也 从 条 一 账户 中 支取 200 美 元 。 请 说 明 ， 这 两 个 不 加 控制 的 交叉 事务 怎样 才能 做 到 账户 的 最 终 余 额 为 
100 美 元 、200 美 元 和 300 美 元 ? 

4. a. 简 述 事务 对 数据 库 中 的 数据 项 请 求 共 侣 访问 的 可 能 综 果 。 

b. 简 述 事务 对 数据 库 中 的 数据 项 请 求 互 斥 访问 的 可 能 结果 。 

. 试 描述 会 导致 执行 数据 库 操作 的 事务 间 出 现 死 锁 的 一 系列 事件 。 

请 说 明 怎 样 打破 第 $ 题 中 的 死 锁 情况 ? 你 的 解决 办 法 是 否 要 用 到 数据 库 管 理 系 统 中 的 日 六 文件 ? 并 

解释 你 的 答案 ， 


全， 


下 
9.5 统 的 文件 结 


本 节 我 们 抛 开 多 维 数据 库 系统 的 研究 来 讨论 传统 的 文件 结构 。 这 些 结构 代表 了 数据 存储 和 
检索 系统 的 历史 开端 , 现在 的 数据 库 技 术 就 是 由 此 发 展 而 来 的 。 为 这 些 结构 开发 的 许多 技术 (如 
索引 技术 和 散 列 技术 等 ) 是 构建 今天 大 规模 、 复 杂 数 据 库 的 重要 工具 。 


9.5.1 顺序 文件 


顺序 文件 〈sequential file) 是 这 样 的 一 种 文件 ， 即 它 从 头 到 尾 者 是 以 顺序 的 方式 进行 访问 
的 ， 好 像 文件 中 的 信息 都 排 成 一 行 。 这 种 文件 的 例子 有 音频 文件 、 视 频 文 件 、 包 含 程序 的 文件 
和 包含 文本 文档 的 文件 等 。 事 实 上 ， 大 多 数 由 个 人 计算 机 用 户 创 建 的 文件 都 是 顺序 文件 。 例 如 ， 
当 保存 一 个 电子 表格 时 ， 它 的 信息 就 会 作为 一 个 顺序 文件 进行 编码 和 保存 ， 电 子 表 格 应 用 软件 
能 够 重新 构建 电子 表格 。 

文本 文件 是 顺序 文件 ， 它 的 每 个 逻辑 记录 是 用 ASCII 码 或 Unicode 码 编码 而 成 的 单个 符号 。 
文本 文件 常常 作为 一 种 基本 的 工具 ， 用 来 构建 诸如 员工 记录 文件 这 些 更 为 复杂 的 顺序 文件 。 为 
此 ， 只 需 建立 一 个 统一 格式 ， 把 每 个 员工 的 信息 表示 为 一 串 文 本 ， 然 后 按照 格式 对 这 些 信息 进 
行 编码 ， 接 下 来 就 把 这 些 员 工 记 录 一 个 接 一 个 地 记录 成 一 个 文本 串 。 例 如 ， 可 以 构建 这 样 的 一 
个 简单 的 员工 文件 ， 即 每 个 员工 记录 为 可 以 输入 31 个 字符 的 字符 串 ， 其 中 25 个 字符 作为 一 段 ， 
用 作 表 示 员 工 的 姓名 《每 段 中 多 余 处 用 空格 填充 )， 随 后 6 个 字符 作为 一 段 ， 用 来 表示 员工 的 工 
号 。 最 终 的 文件 将 会 是 一 个 很 长 的 编码 过 的 字符 串 ， 其 中 每 31 个 字符 组 成 的 字符 块 代 表 了 一 个 
员工 的 信息 〈 见 图 9-14)。 从 文件 中 ， 我 们 可 以 根据 由 31 个 字符 的 信息 块 所 组 成 的 逻辑 记录 来 实 
现 信 息 检 索 ， 每 个 块 中 的 各 个 字段 是 根据 构成 专 的 统一 格式 来 识别 的 。 


9.5 传统 的 文件 结 裙 ”239 


亦 件 由 一 串 块 组 克 ， 
竹 个 块 含有 31 个 字符 


“CT 故国 T 


每 个 堪 有 一 个 站 个 字符 的 字段 表示 员 汪 姓名 ， 
指 幅 汪 : 个 6 不 字符 的 字 外 表示 员 王 的 开 生 





图 9-14 ”以 文本 文件 实现 的 一 个 简单 员工 文件 结构 


顺序 文件 中 的 数据 在 海量 存储 器 里 存放 时 必须 要 保持 文件 的 顺序 特性 。 如 果 海 量 存储 系统 
本 身 具 有 顺序 性 〈 如 磁带 和 CD)， 那 么 就 可 以 直接 做 到 这 一 点 。 在 此 ， 我 们 只 需 根据 存储 介质 
的 顺序 特性 ， 将 文件 记录 到 介质 中 。 然 后 ， 处 理 文件 的 过 程 仅 仅 是 ; 按照 文件 内 容 建立 的 顺序 
来 读 取 和 处 理 它们 。 播 放 音 乐 CD 就 是 这 么 一 个 过 程 ， 因 为 音乐 作为 一 个 顺序 文件 ， 沿 着 螺旋 型 
轨道 ， 一 个 扇 区 接着 一 个 鹿 区 进行 存放 。 

然而 ， 在 磁盘 存储 的 情况 下 ， 文 件 将 分 散在 不 同 的 扇 区 中 ， 因 而 会 以 各 种 次 序 来 谈 取 。 为 
了 保持 正确 的 次 序 ， 大 多 数 操作 系统 〈 更 准确 地 说 是 文件 管理 程序 ) 都 会 维护 一 张 存放 文件 的 
扇 区 列表 。 这 个 表 和 文件 一 样 ， 作 为 磁盘 目录 系统 的 一 部 分 记录 在 同一 磁盘 上 。 即 使 文件 实际 
上 分 散 存 放 在 磁盘 的 不 同 部 分 ， 但 是 利用 这 个 表 ， 操 作 系 统 就 能 以 正确 的 顺序 检索 扇 区 ， 就 好 
像 文件 真 的 是 按 顺 序 存 放 一 样 。 

顺序 文件 处 理 中 一 个 固有 问题 就 是 必须 要 检测 何 时 到 达 文 件 的 末尾 。 通 常 我 们 把 顺序 文件 
的 未 尾 称 之 为 文件 结束 (end-of-file，EOF)。 有 许多 方法 可 以 用 来 标识 EOF， 一 种 方法 是 在 文件 
的 未 尾 放 置 一 个 专用 的 标记 ， 称 为 哨兵 〈sentinel)。 另 一 种 方法 是 利用 操作 系统 的 目录 系统 中 
的 信息 来 确定 一 个 文件 的 EOF。 也 就 是 说 ， 由 于 操作 系统 知道 哪个 扇 区 包含 有 此 文件 ， 它 也 如 
知道 这 个 文件 在 什么 地 方 结 束 。 
-一 个 小 公司 的 工资 单 处 理 就 是 有 关 顺 序 文件 的 一 个 典型 例子 。 这 里 我 们 可 以 想象 出 一 个 顺序 
文件 ， 它 是 由 一 系列 的 逻辑 记录 组 成 ， 每 条 记录 都 包含 有 关 一 个 员工 薪水 的 信息 〈 如 姓名 、 员 工 
工 号 、 工 资 等 级 等 )。 依 据 这 些 信息 就 能 定期 打印 出 支票 ， 每 读 取 一 个 员工 的 记录 ， 就 能 计算 出 
该 员工 的 工资 , 然后 再 打出 相对 应 的 支票 。 处 理 这 样 一 个 顺序 文件 的 操作 ， 可 由 以 下 语句 做 示例 : 


While (未 到 达 EOF ) do 
(从 该 文件 中 提取 下 一 条 记录 并 处 理 它 ) 


当 顺序 文件 中 的 逻辑 记录 用 键 字段 来 标识 时 ， 文 件 通常 就 可 以 这 样 安排 ， 即 按照 由 键 〈 可 能 
是 字母 的 或 者 是 数字 的 ) 决定 的 顺序 来 安排 文件 中 的 记录 。 这 样 一 种 安排 简化 了 文件 信息 的 处 理 
工作 。 例 如 ， 假 定 处 理工 资 时 ， 必 须要 求 依据 考勤 单 的 信息 更 新 每 个 员工 的 记录 。 如 果 包 售 考 勤 
单 记录 的 文件 和 包含 员工 记录 的 文件 都 根据 同一 键 ， 按 照 同样 的 次 序 存 放 ， 那 么 ， 就 能 顺序 地 访 
问 两 个 文件 来 进行 更 新 处 理 ， 即 用 从 一 个 文件 读 取 的 考勤 单 来 更 新 另 一 个 文件 的 相应 记录 。 这 是 
一 个 重大 改进 ， 因 为 如 果 文 件 不 按照 相应 次 序 来 存放 ， 就 必须 反复 地 查找 ， 而 上 述 方法 就 殉 服 了 
这 个 缺点 。 所 以 ， 更 新 典型 的 顺序 文件 ， 通 常 需 要 多 步骤 进行 处 理 。 首 先 ， 新 信息 《例如 考勤 音 
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上 的 信息 ) 记录 在 一 个 称 为 事务 文件 的 顺序 文件 中 , 这 个 事务 文件 按照 要 被 更 新 文件 ( 称 主 文件 ) 
的 次 序 进 行 排序 ， 然 后 ， 通 过 从 两 个 文件 中 顺序 地 读 取 记录 来 对 主 文件 记录 进行 更 新 。 

与 这 种 更 新 过 程 稍 有 不 同 的 是 归并 过 程 ， 即 把 两 个 顺序 文件 合并 成 一 个 包 售 原 来 两 个 文件 
记录 的 新 文件 。 假 定 两 个 输入 文件 的 记录 是 依据 一 个 公共 的 键 按照 升序 来 排列 的 ， 并 假定 归并 
产生 的 输出 文件 也 是 按键 的 升序 来 排列 。 图 9-15 概 述 了 这 个 典型 的 归并 算法 。 其 基本 思想 是 顺 
序 地 扫描 两 个 输入 文件 ， 从 而 构建 出 输出 文件 〈 见 图 9-16)。 


procedure MergeFiles 《InputFileA ,InputFileB ,OutputFile》 


站 《两 个 输入 文件 都 处 于 EOF) then (停止 ，OutputFile 为 空 ) 
和 《InputFileA， 不 在 EOF)》 then《 声 明 它 的 第 一 个 记录 为 当前 记录 ) 
诈 〈《InputFileB， 不 在 EOF) then 《声明 它 的 第 一 个 记录 为 当前 记录 ) 
while《〈 两 个 输入 文件 都 不 在 EOF) do 
将 键 字 段 值 较 小 的 当前 记录 放 在 DutputFile; 
计 【《 该 当前 记录 是 其 对 应 输入 文件 的 最 后 一 个 记录 ) 
then (声明 该 输入 文件 在 EDOF) 
else《【《 声 明 该 输入 文件 中 的 下 一 个 记录 是 该 文件 的 当前 记录 ) 


从 不 在 EOF 的 输入 文件 的 当前 记录 开始 
复制 其 佘 记录 到 OutputFile 





图 15 归并 两 个 顺序 文件 的 过 程 


输出 文件 输入 文件 
加 | 

站 呈 RE 
ER Di 

A 

二 让 9 下 廊 车 本 

LA 6 滞 ] | 





图 9-16 ”归并 算法 的 应 用 〈 字 母 用 于 代表 束 条 记录 ， 具 体 字 母 表 示 记 录 的 键 字 段 的 值 ) 


9.5 传统 的 文件 结构 





9.5.2 索引 文件 


顺序 文件 的 思想 适合 于 数据 处 理 的 次 序 就 是 其 文件 存储 次 序 的 情况 。 然 而 ， 当 文件 必须 以 
一 种 不 可 预测 的 次 序 进 行 检索 时 ， 那 么 这 种 文件 的 效率 就 不 高 了 。 在 这 种 情况 下 ， 所 需要 的 是 
能 快速 找到 所 需 逻 辑 记 录 的 位 置 的 办 法 。 一 种 流行 的 方法 就 是 使 用 文件 索引 ， 这 种 方式 与 书本 
里 的 索引 用 来 定位 主题 在 书 中 位 置 的 方式 非常 一 致 。 这 样 一 种 文件 系统 称 之 为 索引 文件 
《indexed file)。 

文件 的 索引 包含 存放 在 该 文件 中 的 键 的 列表 和 指示 包含 每 个 键 的 记录 存放 位 置 的 项 。 这 样 一 
来 ， 为 了 要 找到 某 个 记录 ， 首 先 需 要 在 引 中 找到 指定 的 键 然后 再 读 取 存 放 在 与 该 键 相关 联 位 置 
的 信息 块 。 

通常 ， 文 件 的 索引 与 被 索引 的 文件 分 开 存放 在 同一 个 海量 存储 设备 里 。 在 文件 的 处 理 开 始 
之 前 ， 通 常 要 先 将 索引 调 入 到 主 存储 器 中 ， 这 样 一 来 ， 当 需要 访问 文件 中 的 记录 时 ， 就 会 很 容 
易 找到 该 记录 〈 见 图 9-17)。 

当 索 引文 件 被 打 
主 和 存 情 器 开 时 ， 索 引 被 传 海量 存储 器 
夺 旬 主 存 储 器 


着 加 一 一 一 环 友 | 


和 
索引 作为 一 个 独 区 件 
立 的 文件 存放 在 


海量 存储 器 | 


图 9-17 打开 索引 文件 


在 维护 员工 记录 的 过 程 中 就 有 索引 文件 的 一 个 典型 例子 。 当 想 检 索 一 个 员工 的 记录 时 ， 如 
全 使 用 索引 就 可 以 避免 见长 的 查找 操作 。 具 体 来 说 ， 如 果 员 工 记 录 文 件 用 员工 工 号 进行 索引 ， 
那么 只 要 知道 员工 的 工 号 ， 就 能 很 快 查 到 该 员工 的 记录 。 另 一 个 例子 是 音乐 CD 的 播放 ， 如 果 利 
用 索引 就 能 相对 较 快 地 访问 到 各 首 乐 曲 。 

多 年 以 来 ， 在 基本 索引 概念 的 基础 上 ， 已 经 使 用 了 许多 不 同 的 索引 技术 。 一 -种 构建 索引 的 
方式 是 运用 层次 化 的 方式 ， 以 便 索 引 旺 现 出 分 层 结构 或 树 结构 。 最 突出 的 例子 就 是 大 多 数 操作 
系统 为 组 织 文 件 存储 所 采用 的 分 层 目录 系统 。 在 这 种 情况 下 ， 目 录 〈 即 文件 夹 ) 就 起 索引 的 作 
用 ， 而 每 个 索引 又 包含 了 指向 其 子 索引 的 链接 。 从 这 个 观点 来 看 ， 整 个 文件 系统 只 是 一 个 大 型 
的 索引 文件 。 


9.5.3 散 列 文件 


尽管 索引 技术 为 访问 数据 存储 结构 中 的 数据 项 提供 了 --- 种 相对 较 快 的 访问 机 制 ， 但 维护 索 
引 的 开销 也 比较 大 。 散 列 (hashing) 技术 也 能 提供 类 似 的 访问 效果 ， 但 无 须 那 样 大 的 开销 。 与 
索引 系统 的 情况 一 样 ， 散 列 技 术 也 是 利用 键 值 来 定位 记录 。 申 人 人 和 人 人 全 二 人 本 下 让 查找 
键 ， 而 是 直接 从 键 中 确定 记录 的 所 在 位 置 。 

散 列 系统 可 以 概括 如 下 : 数据 存储 空间 被 分 成 几 个 区 ， 称 为 存储 桶 《bucket)， 每 个 桶 能 
放 几 条 记录 。 根 据 一 个 将 键 的 值 转换 为 桶 号 的 算法 ， 可 以 将 记录 分 散 存放 于 这 些 桶 中 。 这 里 ， 
将 键 的 值 转换 为 桶 号 的 算法 称 为 散 列 函数 (hashing function )。 每 条 记录 就 存放 在 通过 这 样 处 
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理 确 定 的 桶 里 。 因 此 ， 要 检索 一 条 已 经 置 于 这 种 存储 结构 中 的 记录 ， 首 先 要 把 散 列 函 数 作 用 
于 该 记录 的 标识 键 ， 以 确定 相应 的 桶 ， 然 后 检索 桶 中 内 容 ， 最 后 从 检索 的 数据 中 坦 找 所 需要 
的 记录 。 

获 列 不 仅 能 用 于 从 海量 存储 器 中 检索 数据 ， 也 是 从 存放 在 主 存 的 大 数据 块 中 检索 数据 项 的 
一 种 方法 。 当 散 列 用 在 海量 存储 器 中 的 存储 结构 时 ， 其 结果 称 为 散 列 文件 〈hash file)。 当 攻 列 
用 在 主 存 中 的 存储 结构 时 ， 其 结果 通常 称 为 散 列 表 (hash table )。 

现在 我 们 把 散 列 技术 运用 在 典型 的 员工 文件 中 ， 这 里 ， 每 条 记录 包含 的 是 公司 中 一 个 员工 
的 信息 。 首 先 ， 在 海量 存储 器 中 创建 几 个 可 用 的 区 域 ， 用 来 实现 桶 的 功能 。 至 于 如 何 设 计 次 定 
桶 的 数目 和 每 个 桶 的 大 小 ， 稍 后 青 讨论 。 现 在 ， 我 们 假定 已 创建 了 41 个 桶 ， 桶 号 从 0 一 直到 40。 
(我 们 选择 41 个 桶 ， 而 不 是 偶数 40 个 桶 ， 怕 因 和 后 册 解 笠 。) 


通过 散 列 法 认证 

散 列 法 不 只 是 用 来 作为 构建 高 效 数 据 存储 系统 的 一 种 手段 。 例 如 ， 散 列 法 还 可 以 用 作 认 
证 因特网 上 传送 的 消息 的 一 种 方法 。 其 基本 思想 是 : 以 秘密 方式 对 消息 进行 散 列 运算 ， 然 后 
将 得 到 值 与 消息 一 起 传送 。 为 了 认证 消息 ， 接 收 方 对 收 到 的 消息 进行 散 列 处 理 〔( 以 同样 的 秘 
窗 方 式 )， 并 确认 所 得 到 的 值 与 原始 的 值 是 否 一 致 【《 这 里 假定 经 过 散 列 处 理 后 得 到 相同 的 值 ， 
而 消息 发 生 改 变 的 可 能 性 很 小 )， 如 果 得 到 的 值 与 原来 的 值 不 一 致 ， 就 认为 该 消息 已 被 破坏 。 
那些 对 此 感 兴趣 的 人 可 能 希望 从 因特网 上 搜寻 到 有 关 MD5 的 信息 , 其实 MD5 是 在 认证 应 用 领 
域 有 着 广泛 应 用 的 散 列 函数 ， 

错误 检测 技术 可 以 看 作 散 列 法 在 认证 领域 的 一 种 应 用 ， 其 实 已 经 是 一 目 了 然 的 事 了 。 例 
如 ， 校 验 位 的 使 用 本 质 上 就 是 一 个 散 列 系统 ， 在 此 系统 中 ， 位 模式 只 散 列 为 0 和 1， 然 后 将 这 
个 值 与 初始 位 模式 一 起 传送 。 如 果 最 终 接 收 的 位 模式 不 能 散 列 成 同样 的 值 ， 那 么 就 认为 这 个 
住 模 式 已 被 破坏 。 


现在 我 们 假设 用 员工 工 号 来 作为 识别 员工 记录 的 键 。 这 样 ， 下 一 步 工 作 就 是 设计 一 个 地 列 
函数 ， 把 这 些 键 转换 成 棚 号 。 虽 然 员 工 工 号 可 能 是 2SX3Z 或 J2X35 这 样 的 格式 ， 不 是 数字 型 的 ， 
但 它们 是 以 位 模式 存储 的 ， 我 们 能 够 将 这 些 位 模式 解释 成 数字 ， 利 用 这 个 数字 解释 ， 束 能 让 任 
何 一 个 键 去 除 以 可 用 的 桶 号 , 然后 记 下 余数 。 在 这 个 例子 中 , 余数 将 是 范围 从 0 到 40 的 一 个 整数 。 
因此 ， 我 们 就 可 以 用 每 次 做 除法 得 到 的 余数 来 确定 41 个 桶 中 的 一 个 〈 见 图 9-18 )。 


键 字段 值 : 25X3Z 
ASCH 表 示 ， 00110010001101 自 1010110000011 宪 咎 二 痊 1 咎 工 二 办 汗 昌 
十 进 制 的 等 价值 : 215 643 337 562 
| 
被 41 除 后 的 余数 ， 3 
4 
桶 号 : 3 


图 9-18 ”将 键 字 段 值 25SX3Z 散 列 到 41 个 桶 中 的 一 个 
以 此 作为 我 们 的 散 列 函数 ， 接 下 来 再 分 别 考虑 每 条 记录 ， 继 续 构 建文 件 。 通 过 使 用 散 列 函 
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一 一  ””- > 瑟 忒 有明 式 作 革 和 倡 2 
数 对 其 键 除 以 41 得 到 一 个 桶 号 ， 然 后 再 把 该 记录 存放 在 这 个 桶 中 〔 见 图 9-19)。 以 后 ， 如 果 当 我 
们 再 要 检索 一 条 记录 时 ， 只 需 将 这 个 散 列 函数 应 用 到 该 记录 的 键 ， 以 确定 相应 的 桶 号 ， 然 后 就 
可 以 从 这 个 桶 里 查找 所 要 的 记录 。 


了 了 
冯 1 155 44] 隔 襄 41 条 站 
入】 8 站 
这 可 二 六 


当 除 以 41 时 ， 键 字段 值 14.$$ 96 都 得 
到 余数 14， 所 以 这 些 记录 存放 在 桶 14 中 


四 95 136 站 5| 证 本 医 | 芋 仔 储 器 中 的 桶 
提 二 了 #】44 2 


和 补 卫 与 大 二 
图 9-19 散 列 系统 的 基本 原理 


现在 ， 让 我 们 来 重新 考虑 一 下 把 存储 区 分 成 41 个 桶 的 问题 。 首 先 注意 ， 要 想得到 一 个 有 效 
的 启 列 系统 ， 要 存放 的 记录 应 当 均 匀 地 分 布 在 这 些 桶 中 。 如 果 发 生 : -个 不 成 比例 的 键 数目 恰巧 
散 列 到 同一 个 桶 里 〈 这 种 现象 被 称 为 群集 (clustering))， 那 么 ， 在 一 个 杠 里 就 会 存 入 不 成 比例 
数目 的 记录 。 结 果 是 ， 从 这 个 桶 里 检索 一 条 记录 就 会 花费 更 多 的 查询 时 间 ， 这 也 就 失去 了 散 列 
技术 的 优势 

现在 再 来 看 ， 如 果 我 们 选择 把 存储 区 域 分 成 40 个 彬 ， 而 不 是 41 个 桶 ， 那么 散 列 函数 涉及 的 
除数 《“ 即 除 键 的 值 ) 就 是 40， 而 不 是 41。 但 是 ， 如 果 被 除数 和 除数 有 一 个 公 因子 ， 而 这 个 公 因 
子 也 会 出 现在 余数 中 。 具 体 来 说 ， 如 果 存 储 在 散 列 文件 中 的 数据 项 的 键 磁 巧 都 是 5 的 倍数 (也 是 
40 的 约 数 ), 那么 当 用 40 来 除 时 , 5 这 个 因子 就 会 出 现在 余数 中 ， 并 且 数 据 项 就 会 群集 到 与 余数 0、 
]、10、15、20、25、30 及 35 相 对 应 的 那些 桶 里 。 类 似 的 情况 还 会 出 现在 键 是 2、4、8、 10 及 20 
的 倍数 的 情形 中 ， 因 为 它们 也 都 是 40 的 约 数 。 因 此 ， 我 们 选取 把 存储 区 域 分 成 41 个 栖 ， 因 为 41 
契 去 数 ， 选 取 它 ， 就 可 以 消除 公约 数 ， 从 而 减少 群集 的 可 能 性 。 

但 十， 群集 的 可 能 性 绝对 不 能 完全 消除 ， 即 使 用 的 是 精心 设计 的 散 列 函数 ， 在 文件 构建 过 
程 的 早期 ， 还 是 非常 有 可 能 存在 两 个 键 经 过 散 列 后 ， 得 到 同一 个 值 的 情况 。 这 个 现象 被 称 为 碰 
撞 〈collision)。 为 了 理解 其 中 的 原因 ， 考 虑 下 面 的 情况 。 

假设 我 们 已 经 建立 了 一 个 在 41 个 桶 中 随机 分 配 记录 的 散 列 函 数 ， 这 时 候 的 存储 系统 是 空 的 ， 
并 且 准备 一 次 插入 一 条 记录 。 当 插入 第 1 条 记录 时 ， 它 将 会 被 放 进 -个 空 桶 里 。 然而 ， 当 播 入 第 
2 条 记录 时 ，41 个 桶 中 还 有 40 个 桶 是 空 的 ， 这 样 一 来 ， 第 2 条 记录 被 放 进 空 桶 的 概率 只 有 40 / 41。 
假设 第 2 条 记录 被 放 进 了 一 个 空 桶 ， 那么 当 放 第 3 条 记录 时 就 只 能 找到 39 个 空 桶 ， 所 以 ， 被 放 进 
空 桶 的 概率 是 39 / 41。 继 续 这 个 过 程 ， 就 可 以 发 现 ， 如 果 前 7 条 记录 都 被 放 进 了 空 桶 ， 那 么 第 8 
条 记录 被 放 进 余下 空 桶 的 概率 就 只 有 34 / 41。 

基于 以 上 的 分 析 , 我 们 就 能 计算 出 所 有 前 8 条 记录 都 被 放 进 空 桶 的 概率 ,， 即 每 条 记录 被 放 入 
宇 桶 概率 的 乘积 ， 这 里 假设 前 面 的 记录 都 已 被 放 入 空 桶 。 那 么 这 个 概率 为 


(417 41)(40 7 41)(39 7 41)(38 / 41)…(34 / 41)=0.482 
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问题 是 这 个 结果 小 于 一 半 。 也 就 是 说 ， 当 在 41 个 桶 里 分 配 记录 时 ， 很 可 能 在 存放 第 8 条 记录 的 时 
候 ， 就 会 发 生 碰撞 现象 。 

发 生 磁 撞 的 高 概率 表明 ， 不 管 如 何 精心 选择 散 列 函数 ， 设 计 任 何 一 个 散 列 系统 时 都 必须 要 
考虑 到 群集 现象 。 特 别 是 ， 一 个 桶 有 可 能 会 装 满 或 者 溢出 。 这 种 问题 的 一 种 解决 方法 就 是 ， 允 
许 扩展 桶 的 大 小 。 另 一 种 解决 方法 是 ， 允 许 桶 溢出 到 一 个 专门 为 解决 这 种 问题 而 保留 的 证 出 区 。 
无 论 如 何 ， 群 集 情 况 和 溢出 情况 的 出 现 都 将 使 散 列 文件 的 性 能 明显 降低 。 

研究 表明 ， 作 为 一 般 规 律 ， 只 要 记录 的 数目 与 文件 中 总 的 记录 容量 之 比 〈 将 这 个 比率 称 为 
负载 因子 〈load factor)) 保持 在 50% 以 下 ， 那 么 散 列 文件 就 会 表现 出 良好 的 性 能 。 但 是 ， 如 果 
负载 因子 攀升 至 超过 75% ， 那 么 系统 的 性 能 通常 就 会 降低 〈 严 重 的 群集 现象 会 造成 有 些 桶 装 满 
或 者 可 能 溢出 )。 由 于 这 个 原因 ， 如 果 散 列 存储 系统 的 负载 因子 接近 75%% 这 个 值 ， 那 么 它 通 贡 会 
以 一 个 更 大 的 容量 进行 重建 。 最 后 得 出 结论 ， 通 过 实现 散 列 系统 来 获得 记录 检索 的 高 效率 是 需 
要 花费 一 定 代价 的 。 


问题 与 练习 
.依据 图 #15 所 示 的 归并 算法 ， 假 设 一 个 输入 文件 包含 键 字段 值 等 于 B 和 了 E 的 记录 ， 而 另 一 个 输入 文件 
包含 A、C、D 和 PF， 试 归并 这 两 个 文件 。 
归并 算法 是 一 种 称 为 归并 排序 的 流行 的 排序 算法 的 核心 。 你 能 否 说 明 这 种 算法 ? (提示 : 任何 非 空 
的 文件 可 以 看 成 是 单项 文件 的 集合 。) 
, 文件 是 顺序 的 是 物理 属性 ， 还 是 概念 属性 ? 
， 从 索引 文件 中 检索 记录 要 求 哪些 步骤 ? 
. 试 说 明 : 如 果 选 取 了 不 恰当 的 散 列 函数 ， 其 散 列 存储 系统 的 性 能 不 比 顺 序 文件 优越 。 
, 假设 一 个 散 列 存储 系统 是 用 文中 提 到 的 除法 散 列 函数 构建 的 ， 但 是 这 里 只 用 6 个 存储 棚 。 对 以 下 各 键 
值 ， 确 定 相应 记录 应 该 放 进 哪个 桶 。 会 出 现 什 么 问题 ? 为 什么 ? 
8.24 b 3 EC 如 ,1 名 已 ，] 与 
二 .2 世 , 身 h. 39 .之 7 .站 
7. 要 想 出 现 两 个 人 的 生日 在 同一 天 的 机 率 ， 至 少 需要 多 少 人 ? 试 说 明 这 个 问题 与 本 节 内 容 有 何 凑 系 ? 
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9.6 ”数据 挖掘 

一 个 迅速 发 展 的 并 与 数据 库 技 术 紧密 相关 的 学 科 就 是 数据 挖 所， 它 包 括 了 在 数据 集 上 发 现 
模式 的 技术 。 数 据 挖掘 已 经 成 为 许多 领域 的 重要 工具 ， 包 括 市 场 营 销 、 库 存 管理 、 质 量 控制 、 
借贷 风险 管理 、 其 诈 检 测 和 投资 分 析 等 。 数 据 挖 据 技 术 甚至 可 以 运用 于 那些 似乎 不 大 可 能 会 用 
到 的 场合 ， 例 如 用 于 确定 某 些 以 DNA 分 子 进 行 编码 的 基因 功能 以 及 描述 有 机 组 织 的 特性 。 

数据 挖 所 活动 与 传统 的 数据 库 查 询 不 同 ， 原 因 在 于 数据 挖掘 所 做 的 工作 是 寻找 确定 以 前 未 
知 的 模式 ， 而 传统 数据 库 需 要 做 的 只 是 检索 已 经 存储 好 了 的 事实 。 此 外 ， 数 据 挖 掘 操作 的 是 静 
态 的 数据 集合 ， 称 为 数据 仓库 〈data warehouse)， 而 不 是 经 常 要 更 新 的 “联机 ”运行 的 数据 库 。 
这 些 仓库 往往 是 数据 库 或 数据 库 集 的 “快照 ” 因为 静态 系统 中 寻找 模式 要 比 动态 系统 中 简单 ， 
所 以 用 它们 来 替代 实际 运行 的 数据 库 。 

还 需要 注意 的 是 ， 数 据 挖掘 的 主题 不 单 局 限于 计算 领域 ， 而 且 还 涉及 统计 学 领域 。 事 实 上 ， 
很 多 人 认为 ， 由 于 数据 挖掘 源 自 于 试图 对 大 量 不 同 的 数据 集 进行 统计 分 析 ， 因 而 它 更 像 是 统计 
学 的 一 种 应 用 ， 而 并 非 计 算 机 科学 的 一 个 领域 。 

数据 挖掘 有 两 种 常见 的 形式 : 类 型 描述 (class description ) 和 类 型 识别 (class discrimination )。 
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关 型 描述 用 来 确定 描绘 一 组 数据 项 的 属性 ， 而 类 型 识别 用 来 确定 区 分 两 组 数据 项 的 属性 。 例 如 ， 
关 型 描述 技术 可 以 用 来 发 现 购买 经 济 型 轿车 的 人 的 特点 ， 而 类 型 识别 技术 可 以 用 来 发 现 能 区 分 
头 二 手 芋 与 买 新 车 的 顾客 的 特性 。 


生物 信息 学 


数据 库 技 术 和 数据 挖 握 技术 的 进步 ， 扩 展 了 生物 学 家 在 涉及 模式 识别 和 有 机 化 合 物 分 类 
研 饥 领域 的 可 使 用 工具 。 结 果 就 产生 了 生物 学 的 一 个 新 领域 ， 称 为 生物 信息 学 .现在 的 生 易 
信息 学 源 于 对 DNA 解 码 的 努力 ， 它 包括 了 如 蛋白 质 分 类 和 理解 蛋白 质 相 互 作用 序列 【 称 为 生 
物化 学 路 径 ) 的 这 样 一 些 研究 。 虽 然 通常 认为 生物 信息 学 是 生物 学 的 一 个 部 分 ， 但 它 很 好 地 
例证 了 订 愉 机 科学 是 如 何 影响 甚至 扎根 于 其 他 领域 的 . 452 


尺 一 种 数据 挖掘 的 形式 是 聚 类 分 析 (cluster analysis)， 它 用 来 以 发 现 类 型 。 注 意 ， 这 与 类 
型 描述 不 同 ， 类 型 描述 是 用 来 发 现 已 经 确定 的 类 型 中 成 员 的 属性 。 更 明确 地 说 ， 聚 类 分 析 试图 
找到 那些 能 引导 发 现 组 群 的 数据 项 的 特性 。 例 如 ， 在 分 析 观 看 某 部 电影 观众 的 年 龄 信息 的 过 程 
中 ， 通 过 聚 类 分 析 可 能 会 发 现 ， 观 众 会 分 成 两 个 年 龄 组 ， 即 4 岁 到 10 岁 一 组 和 25 岁 到 40 岁 一 组 ， 
(也 许 这 影片 吸引 了 和 孩子 和 他 们 的 父母 ? )。 

还 有 一 种 数据 挖 握 的 形式 ， 称 为 关联 分 析 (association analysis)， 它 的 工作 是 寻找 数据 组 之 
癌 的 联系 。 要 找到 寻 买 士 豆 片 又 买 啤酒 饮料 的 顾客 ， 或 者 在 高 店 正常 的 营业 时 间 购 物 又 享受 退 
休 优 惠 的 顾客 ， 正 是 通过 关联 分 析 。 

牟 立 点 分 析 〈outlier analysis) 是 数据 挖 据 的 另 一 种 形式 ， 它 试 图 识别 出 不 符合 规则 的 数据 
项 。 狐 立 点 分 析 可 以 用 于 确定 数据 集中 的 错误 ， 它 还 可 以 检测 信用 卡 ， 如 果 发 现 信用 卡 突然 偏 
离 客 户 的 正常 消费 模式 ， 那 么 就 可 以 确定 该 信用 卡 被 盗用 ， 甚 至 可 以 通过 发 现 反常 的 行为 来 识 
别 出 潜 在 的 恐怖 分 子 。 

最 后 ， 还 有 一 种 数据 挖掘 形式 ， 称 为 序列 模式 分 析 《sequential pattern analysis)， 它 试图 确 
定 随时 间 变化 的 行为 模式 。 例 如 ， 序 列 模式 分 析 可 以 揭示 诸如 资本 市 场 之 类 的 经 济 系统 中 的 趋 
势 ， 或 者 诸如 气候 环境 之 类 的 环境 系统 中 的 趋势 。 

上 上面 最 后 的 例子 表明 ， 数 据 挖掘 的 结果 可 以 用 来 预测 未 来 的 行为 。 如 果 - 一 个 数据 项 具有 雪 
征 某 个 类 型 的 属性 ， 那 么 这 个 数据 项 就 可 能 表现 为 这 个 类 型 的 成 员 。 然 而 ， 许 多 数据 挖掘 项 目 
只 古旧 在 获得 对 数据 的 更 好 理解 ， 如 利用 数据 挖 气 来 解 开 DNA 之 谜 。 无 论 如 何 ， 数 据 挖 据 具 有 
巨大 的 潜在 应 用 领域 ， 并 且 有 望 成 为 未 来 一 个 活跃 的 研究 领域 . 

注意 到 ， 数 据 库 技术 和 数据 挖掘 之 间 的 关系 就 像 堂 兄弟 一 样 ， 一 个 领域 的 研究 成 果 在 另 _- 
个 领域 也 会 有 反映 。 数 据 库 技 术 广泛 运用 ， 使 得 数据 仓库 具有 以 多 维 数据 集 〈data cubes)〔 从 
多 角度 看 竺 数据， 用 “cube” 这 个 术语 来 表示 多 维 的 概念 形式 表示 数据 的 能 力 ， 这 就 使 得 数 
损 挖 所 成 为 可 能 。 反 过 来 ， 当 数据 挖掘 方面 的 研究 人 员 提高 了 实现 多 维 数据 集 的 技术 时 ， 这 些 
成 果 也 给 数据 库 设 计 领 域 带 来 了 好 处 。 

最 后 ， 我 们 应 当 认识 到 ， 成 功 的 数据 挖 据 远 不 止 包括 数据 集 范 围 内 的 模式 识别 。 明 智 的 判 
浙 还 要 确定 哪些 模式 是 有 实际 意义 的 ， 还 只 是 偶然 的 。 某 个 便利 店 卖 出 了 大 量 彩 票 这 样 一 个 事 
实 对 于 计划 买 彩票 的 某 个 人 来 说 ， 不 可 能 有 什么 重要 意义 ， 但 是 对 于 食品 杂货 店 经 理 来 说 ， 发 
现 有 些 买 了 快餐 的 顾客 也 常会 买点 冷冻 食品 ， 那 就 是 一 条 很 有 意义 的 信息 了 。 同 样 ， 数 据 挖 所 
也 包括 了 大 量 的 道德 方面 问题 ， 包 括 数据 仓库 表述 的 个 体 的 权利 、 所 得 结论 的 准确 性 和 用 处 ， 
甚至 涉及 数据 挖 据 初 更 的 恰当 性 。 T55 
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问题 与 练习 

1， 为 什么 数据 挖掘 不 在 “联机 ”数据 库 上 实施 ? 

2. 试 举 出 另 一 个 模式 的 例子 ， 要 求 文中 提 到 的 每 种 数据 挖掘 类 型 都 可 以 在 此 例 中 找到 。 
3. 给 出 几 种 不 同 的 观点 ， 可 以 在 挖掘 销售 数据 中 用 到 多 维 数 据 集 。 

4. 数据 控 搓 与 传统 数据 库 查 询 有 何不 同 ? 


的 向 避 本 1 让 全 | 二 于 朝 征 站 证 二 二 王 ELEHH 生 和 ra 让 -二 ta .和 P 站 -二 后盾 下 生生 站 和 生 车 竺 的 本 放生 下 R 玫 生 于 二 站 各 其 阁 和 二 司 和 有 后 二 二 人 站 于 看 FE 
9.7 ”数据 库 技术 的 社会 影响 


随 着 数据 库 技术 的 发 展 ， 以 往 不 可 能 得 到 的 信息 现在 可 以 获取 到 。 许 多 情况 下 ， 目 动 化 图 
书馆 系统 记录 了 每 个 用 户 的 阅读 记录 ， 零 售 商 保存 了 每 个 客户 的 购买 记录 ， 因 特 网 搜索 引擎 傈 


” 留 了 客户 端的 请 求 记 录 。 反 之 ， 这 些 信息 对 以 下 群体 也 具有 潜在 的 价值 ; 市 场 营销 公司 、 法 律 


实施 机 构 、 雇 主 以 及 私有 个 体 。 

这 代表 了 渗透 到 数据 库 应 用 整个 范围 的 潜在 问题 。 基 于 现在 的 技术 ， 收 集 大 量 的 信息 ， 进 
行 集成 以 及 对 比 变 得 非常 容易 ， 而 这 些 信 息 以 前 则 是 不 可 获取 的 。 这 种 衍生 物 〈 如 同 是 一 把 双 
刃 剑 ) 非常 庞大 ， 它 不 仅 是 学 术 界 辩论 的 主题 ， 更 是 真实 存在 的 事实 。 

现在 的 数据 收集 工作 以 很 大 的 规模 来 实施 ， 在 有 些 情况 下 比较 明显 ， 而 另外 一 些 情况 下 就 
显得 比较 微妙 了 。 前 一 种 情况 的 例子 是 受 访 者 被 要 求 直接 提供 信息 。 这 可 能 以 自愿 的 方式 进行 ， 
如 民意 调查 或 竞赛 登记 等 形式 ， 也 可 能 以 非 自愿 的 方式 进行 ， 如 当 以 政府 规定 强制 进行 的 情况 
等 。 有 时 ， 自 愿 与 和 否 取决 于 个 人 的 观点 。 当 申请 借贷 时 提供 个 人 信息 ， 是 自愿 还 是 非 自 愿 ? 这 
种 不 同 取决 于 获得 贷款 是 为 了 方便 还 是 必需 的 。 现 在 有 些 零 售 店 使 用 信用 卡 时 ， 要 求 以 数字 化 
格式 记录 签名 。 同 样 ， 提 供 这 种 信息 是 否 自愿 ， 也 是 取决 于 所 处 的 环境 。 

数据 收集 比较 微妙 的 情况 下 ， 就 避免 了 与 对 象 直 接 进 行 交 流 。 这 样 的 例子 有 :信用卡 公 司 
记录 下 了 信用 卡 持 有 者 的 所 有 购物 活动 ， 网 站 记录 下 了 访问 者 的 身份 ， 社 会 活动 调查 员 记 录 下 
了 停 在 目标 单位 停车 场 的 汽车 的 车 牌号 。 在 这 些 情况 下 ， 数 据 收集 的 对 象 不 会 意识 到 他 们 的 信 
息 被 收集 ， 更 不 大 可 能 知道 存在 为 此 建立 的 数据 库 。 

有 时 候 ， 如 果 停 下 来 想 想 ， 这 种 潜在 的 数据 收集 活动 就 很 清楚 了 。 例 如 ， 杂 货 店 可 能 会 为 
已 经 登记 过 的 常客 提供 折扣 。 登 记过 程 中 可 能 要 发 一 个 身份 认证 卡 ， 在 购物 时 要 出 示 该 卡 才能 
获得 折扣 。 这 样 就 使 得 商店 收集 了 大 量 客户 的 购物 记录 ， 而 这 种 记录 的 价值 远 远 超出 了 折扣 的 
价值 。 

当然 ， 促 成 数据 收集 兴旺 的 动力 就 是 数据 的 价值 ， 它 的 作用 因数 据 库 技术 的 发 展 而 得 到 扩 
大 ， 这 些 数 据 库 技术 使 数据 能 够 联系 起 来 ， 这 就 揭示 出 了 原本 隐藏 的 信息 。 例 如 ， 对 信用 卡 持 
有 者 的 消费 模式 进行 分 类 和 交叉 列表 ， 就 能 获得 极 具 市 场 价值 的 顾客 资料 概况 。 利用 这 些 信息 ， 
健美 杂志 就 可 向 那些 最 近 买 过 健身 器 材 的 人 寄 去 订阅 单 ， 而 驯 狗 杂志 的 订阅 单 则 会 寄 给 那些 前 
不 久 买 过 狗 食 的 人 。 有 时 候 ， 信 息 的 组 合 方式 实在 是 富有 想象 力 。 如 将 犯罪 记录 与 社会 福利 记 
录 进 行 对 比 ， 可 以 找到 和 抓获 假释 的 罪犯 ，1984 年 美国 的 义务 兵役 机 构 利 用 从 一 家 著名 的 冰 淇 
淋 店 获得 的 生日 登记 表 ， 找 出 了 那些 逃避 兵役 登记 的 公民 。 

有 一 些 方法 能 够 用 来 保护 社会 ， 防 止 数 据 库 滥 用 。 一 种 办 法 就 是 通过 法 律 手段 。 但 是 ， 通 
过 一 个 法 案 来 反对 一 种 行为 ， 仅 仅 是 让 这 种 行为 不 合法 ， 但 阻止 不 了 行为 的 发 生 。 最 好 的 例子 
是 1974 年 美国 通过 的 隐私 权 法 案 ， 其 目的 是 保护 公民 ， 防 止 政 府 浇 用 数据 库 。 该 法 案 中 一 个 条 
款 规 定 政府 部 门 要 在 联邦 注册 署 公布 其 数据 库 通告 ， 允 许 公民 访问 和 纠正 他 们 的 个 人 信息 。 然 
而 ， 政 府 部 门 却 迟 迟 不 能 遵照 这 个 条 款 。 这 倒 并 非 一 定 说 明 那 些 部 门 是 出 于 什么 恶意 的 目的 ， 
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在 许多 情况 下 ， 是 属于 官僚 作风 的 问题 。 但 是 ， 官 僚机 构 构 建 的 人 事 数据 库 不 能 有 效 鉴别 身份 
这 样 一 个 事实 ， 却 是 令 人 不 安 的 。 

刃 一 个 也 许 更 有 效 地 控制 选用 数据 库 的 办 法 是 公众 与 论 。 如 果 损失 大 于 好 处 ， 人 们 就 不 会 
去 选用 数据 库 ， 而 且 ， 企 业 最 害怕 的 惩罚 就 是 负面 的 公众 与 论 ， 因 为 这 将 直击 要 害 。20 世 纪 90 
年 代 初 期 ， 正 是 公众 与 论 阻 止 了 一 些 主要 信贷 机 构 为 商业 用 途 出 售 其 客户 名 单 。 更 近 一 点 的 例 
子 ， 糯 国 在 线 《〈 一 家 主要 的 因特网 服务 提供 商 ) 在 公众 压力 下 ， 放 弃 了 向 电话 销售 员 出 售 客户 
相关 信息 的 政策 。 即 使 是 政府 机 构 也 会 向 公众 与 论 妥 协 。1997 年 ， 美 国 社会 保障 局 修改 了 通过 
因 符 网 查阅 社会 保障 记录 的 计划 ， 这 是 因为 公众 舆 论 对 信息 的 安全 性 产生 了 质疑 。 在 这 些 案例 
中 ， 儿 天 藉 能 得 到 结 果 ， 这 与 了 元 长 的 司法 过 程 完全 不 同 。 

当然 ， 在 许多 情况 下 ， 数 据 的 持 有 者 和 数据 的 主体 都 受益 于 数据 库 应 用 ， 但 是 在 所 有 情 
况 下 ， 郑 不 能 轻视 秘密 的 丢失 。 当 信息 准确 时 ， 私 密 性 问题 就 比较 严重 ， 而 当 信息 错误 时 ， 
秘密 性 问题 就 变 得 硕大 无 比 。 当 你 意识 到 自己 的 信用 度 受 到 了 错误 信息 的 负面 影响 时 ， 你 可 
以 想象 出 那 种 无 望 的 感觉 。 不 难 想象 ， 在 一 个 错误 信息 很 容易 被 传 开 的 环境 里 ， 问 题 会 怎样 
地 扩大 。 

一 般 来 说 ,秘密 性 问题 是 并 且 仍 将 是 技术 , 特别 是 数据 库 技 术 进步 带 来 的 一 个 主要 副作用 。 
这 齿 问 题 的 解决 需要 有 受 教育 的 、 警 觉 的 、 积 极 的 公民 。 


问题 与 练习 

1. 古 特 能 赋 子 执法 部 门 为 了 确定 有 犯罪 倾向 的 人 而 访问 数据 库 的 权利 ， 即 使 这 些 人 并 无 前 科 ? 

2. 是 吾 能 赋 子 保险 会 司 为 了 确认 有 潜在 健康 问题 的 人 而 访问 数据 库 的 权利 ， 即 使 这 些 人 并 无 任何 疗 
状 ? 

, 假设 你 的 经 济 情况 良好 。 如 果 这 个 信息 在 很 多 单位 传 开 ， 从 中 你 会 获得 什么 好 处 2? 同样 信息 的 散布 ， 
叉 会 有 什么 不 利 ? 又 若 你 的 经 济 情况 不 理想 ， 结 果 又 将 如 何 ? 

. 新 闻 出 版 自由 在 控制 数据 库 的 选用 上 起 到 什么 作用 ? (例如 ， 新 闻 或 新 闻 曝 光影 响 公 众 舆 论 到 了 何 种 
程度 ? ) 


4 


心 


本 于 珊 相 ni 有 和 于 和 天 和 利和 HITRSE 租 和 六 下 于 9 于 县 间 着 生 瑟瑟 :、 卜 5 河和 让 关 EE 生 于 cn 再 -和 下 下 有 证 全 天 笛 用 了 jg 让 后生 站 相生 于 直上 计 此 Ed 二 下 


复习 题 
( 带 * 的 题目 先 及 选读 小 节 的 内 容 。) d. 允许 用 户 节 错 几 次 口令 才 终 止 对 话 ? 
1. 概述 平面 文件 与 数据 库 之 间 的 不 同 。 e， 怎 样 才 能 实现 PROJECT 运 算 ? 
2. 数据 独立 性 是 什么 意思 ? 8. 下 列 哪 一 项 工作 是 由 DBMS 完 成 的 ? 
3. 在 数据 库 实 现 的 层 旗 化 方法 中 , DBMS 的 作用 a 硝 休 用户 对 数据 库 的 访问 权限 制 在 相应 的 
是 什么 ? 子 模式 内 。 
4, 模式 和 子 模式 有 什么 不 同 ? b. 把 基于 数据 库 模 型 的 一 些 指令 翻译 成 对 实 
5. 指出 把 应 用 软件 与 DBMS 分 离 的 两 个 好 处 。 际 数据 存储 系统 的 活动 。 
6. 描述 抽象 数据 类 型 〈 第 8 章 中 讲 到 的 ) 与 数据 c， 隐 茂 数 据 库 中 的 数据 分 散在 网 络 中 的 许 才 
库 模 型 的 相似 之 处 。 计算 机 内 这 一 事实 。 
7. 说 出 下 列 情况 或 活动 在 数据 库 系 统 〈 用 户 、 应 用 9. 在 一 个 关系 数据 库 中 , 怎样 表示 以 下 有 关 航 空 
软件 程序 员 、DBMS 软 件 设计 者 ) 中 发 生 的 级 别 : 公司 、 航 班 〈《 对 某 一 天 而 言 ) 和 乘客 的 信息 ， 
a. 数据 在 磁盘 上 怎样 存储 效率 才 最 商 ? 航空 公司 : Clear Sky、Long Hop、Tree Top 
b.，243 航 班 还 有 空位 吗 ? Clear Sky 的 航班 :， CS205、CS37、CS102 


5c. 在 海量 存储 器 中 ， 关 系 应 当 如 何 组 织 ? Long Hop 的 航班 ，LH67、LH89 


和 


世 
fn 
全 


457 
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Tree Top 的 航班 ， TT33[、TT809 
Smith 已 预订 CS205 (12B 座 ) 、CS37 (18C 座 ) 
和 LH89 (14A 座 )。 

Baker 已 预订 CS37(18B 座 ) 和 LH89 (14B 座 )。 


Clark 已 预订 LH67 (5A 座 ) 和 TT331 (4B 座 ) 。 
10. 对 一 个 关系 应 用 SELECT 和 PROJECT 运 算 的 次 


序 有 什么 意义 ? 或 者 说 ， 在 怎样 的 条 件 下 ， 先 
做 SELECT 再 做 PROJECT 的 结果 ， 与 先 做 
PROJECT 运 算 再 做 SELECT 操作 的 结果 一 样 ? 


11. 给 出 一 个 论据 , 证 明 ( 如 9.2 节 描述 的 ) 在 JOIN 


运算 中 where 子 句 是 不 必要 的 。《 也 就 是 说 ， 
要 证 明 任 何 用 到 where 子 句 的 查询 语句 都 能 够 
通过 下 面 这 样 的 方式 重新 表示 ， 用 JOIN 栋 作 
把 一 个 关系 中 的 每 一 个 元 组 与 另 一 个 关系 中 
的 每 一 个 元 组 连接 起 来 。) 


12. 对 下 列 关 系 ， 执 行 以 下 各 指令 后 ， 关 系 


RESULT 是 怎样 的 ; 


X 基 系 
U YY 


W R 和 马 
二 
发 


a. RESULT-< 一 PROJECT WW from 基 

b. RESULT-SELECT from 共 where  W 
三 

c. RESULT--PROJECT SS from 工 

HL RESULT~JOIN X and 立 Where 苇 
W 二 熙 R 


Y 关系 


13. 根据 以 下 数据 库 ， 利 用 SELECT、PROJECT 


和 JOIN 命令 ， 写 出 指令 厚 列 来 回答 下 列 有 关 
部 件 与 生产 商 的 问题 : 


PART 关系 
PartName Weight 


四 C 人 ft 之 并 ] 
Bolt 2Z 1 .5 
Nut V5 0.5 


已 总 f 站 让 是 mWY 站 
Cormpany 其 


Company 站 
万 rmpany 站 
避 Orm 可 mw 于 
Companwy 之 





a. 哪些 公司 生产 了 Bolt 2Z? 


14. 
. 利用 SELECT、PROJECT 和 JOIN 命令 ， 写 出 


42. 


| 


24， 
24. 


b、 获 取 一 个 由 Company X 生 产 的 部 件 及 其 价 
格 清单 。 

c. 哪些 公司 生产 重量 为 1 的 部 件 ? 

用 SQL 回答 第 13 题 。 


指令 序列 来 回答 以 下 几 个 有 关 图 %5 中 的 

FMPELOYEE、JOB 和 asSSITGNMENT 基 系 中 信息 

的 问题 : 

a， 获 取 公 司 员工 姓名 和 地 址 清单 。 

b， 获 取 在 人 事 部 工作 和 曾经 工作 过 的 人 员 姓 
名 和 地 址 清单 。 

c. 获取 正在 人 事 部 工作 的 人 员 姓 名 和 地 址 请 
单 。 

用 SQL 回答 上 题 。 


. 设计 一 个 包含 作曲 家 、 生 平 及 其 作品 信息 的 基 


系数 据 库 〈 避 免 类 似 于 图 9-4 中 的 元 余 )。 


,. 设计 一 个 包含 乐队 .唱片 以 及 所 录 乐 曲 的 作曲 


者 信息 的 关系 数据 库 〈 避 免 类 似 于 图 9-4 中 的 
元 余 ) 。 


. 设计 一 个 包含 计算 设备 生产 商 及 其 产品 的 头 


系数 据 库 〈 避 免 类 似 于 图 9-4 中 的 元 余 ) 。 
设计 一 个 包含 有 关 出 版 商 . 杂 志 及 订户 信息 的 
关系 数据 库 《 避 免 类 似 于 图 9-4 中 的 元 余 ) 。 


. 设计 一 个 包含 有 关 零 部 件 、 供 应 商 及 客户 信息 


的 关系 数据 库 。 每 种 零 部 件 可 有 几 个 供应 商 供 
应 ， 并 可 有 多 个 客户 订购 。 每 个 供应 商 可 以 供 
应 许多 种 零 部 件 , 也 可 有 多 个 客户 。 每 个 客户 
可 以 向 多 个 供应 商 订购 多 种 零 部 件 ， 实 际 上 ， 
同一 种 雯 部 件 可 问 一 个 以 上 的 供应 商 订 购 ( 如 
免 类 似 于 图 9-4 中 的 元 余 ) 。 

写 出 指令 序列 〈 利 用 SELECT、PROJECT 及 
JOIN 运算 ) 来 实现 从 图 9-5 所 示 的 关系 数据 库 
中 检索 财务 部 每 个 职务 的 JobId 、 

SaTtDate 丰 TermDate。 

用 SQL 回答 上 题 。 

习 出 指令 序列 〈 利 用 SELECT、PROJECT 玉 
JOIN 运算 ) 来 实现 从 图 9-5 所 示 的 关系 数据 库 
中 检索 现任 每 位 员工 的 Name、address、 


JoDpbTit1e 太 Dept。 


. 用 SQL 回答 上 题 。 
. 写 出 指令 序列 〈 利 用 SELECT、PROJECT 及 


JOIN 运算 ) 来 实现 从 图 9-5 所 示 的 关系 数据 库 
中 检索 现任 每 个 员工 的 Name 及 Jobritle。 


. 用 SQL 回答 上 题 。 
， 由 单一 关系 
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人 arme Departrment “ “TelephoneNumber 
吉 癌 mm 号 总 司 | 旧 号 三 三 后 -守卫 过 过 
号 rmith 号 局 | 三 555-3333 
白丁 KK :| 555-44444 
和 两 个 关系 
了 网 囊 Fm 司 DepartrmeEnit 
Jonmes 号 日 lasS 
二 rmith Saltes 
日本 Ker 户 FSGmnme| 
Department “ TelephoneNurmber 
写 引 | 生生 后 与 后 -之 过 迪 二 
Sales 555-3333 
展 efSDmnmal 后 三 后 -二 吕 4 人 4 
提供 的 信息 有 什么 不 同 ? 


29. 设计 一 个 包含 汽车 部 件 及 其 子 部 件 的 关系 数 
据 库 .要 做 到 : 一 个 部 件 可 以 包含 更 小 的 零件 ， 
同时 它 本 身 可 以 是 更 大 部 件 的 零件 。 

30. 选择 一 个 常用 的 网 站 ， 像 www.google,com、 
www,amazon.com 或 www.ebay.com， 设 计 一 个 
关系 数据 库 ， 作 为 网 站 的 支持 数据 库 。 

31. 基于 图 9-5 所 示 的 数据 库 ， 说 明 以 下 程序 段 回 
答 的 问题 : 


TEMPE=<-SELBCT frcm 疡 SSIGNMENT Where 
下 宫 工 总 丰 已 三 下 光 
及 及 BUILT 一 户 及 站 JJ 已 CT JJDbIG， 纪 总 工 七 吕 志 世人 鞋 FTOm 


工 世 ME 


32. 把 上 题 中 的 查询 翻译 成 SQL 语句 。 
33. 基于 图 9%-5 所 示 的 数据 库 ， 说 明 以 下 程序 段 回 
答 的 问题 ， 


TEMP1 二 JOIN EMPLOYEE ana ASSIGNMENT 

Where 开 MPLOYEE 。 npPlIGQ = ASSIGNMENT . 
EmplI 

TMP 与 甩 也 已 CT 上 DOm 了 EMP1 

钢 所 起 荆 全 下 人 FTIRDa 七 全 = “二 

RESUTILT < 二 PROJECT 末 armie， 号 上 az 了 中 七 鞋 TOmL 
工 世 对 忆 2 


34. 把 上 题 中 的 查询 翻译 成 SQL 语句 。 
35. 基于 图 9-5 所 示 的 数据 库 ， 说 明 以 下 程序 段 回 
答 的 问题 : 


TEMP1 -一 JOIN 已 MPEELOYEB anq JOB 
WW 有 已 工 曰 ” 马 METL OOYE 瑟 ， 了 PT 工 台 = 可 局 也 .EnmD] 工 所 
下 站 ME 一 号 已 DECT 二 Dm TEMP] 


调 上 站 下 导电 贡 七 三 省 呈 员 于 瑟 号 ” 
民 正 二 UL 一 下 恨 品 JECT ame 于 工 各 有 TEMPz 


36. 把 上 题 中 的 查询 翻译 成 SQL 语句 。 
37. 把 SQL 语句 


富 所 ect JOB.JDObT1It] 

trom 天 SSIGMNMENT ,JOB 

where &aSSIGNMENT .JopIGQ = JOB .JobIO9 
ana aaSSIGNMENT . EmPp1lIQ = ”34Y7D” 


翻译 成 SELECT、PROJECT 及 JOIN 运算 的 序 
列 。 
38. 把 SQL 语句 


号 名 ] 记 冯 七 记号 号 工 辐 网 MER 何 工 ， 马 七喜 工 七 也 总 蕊 
Ereom 天 SSITCNMENT， 刁 MBEELOYEE 
Where 上 SSIGCNMENT .EnmP1 19 = 
眉 MPTLOYEEE .PEmD] 1] 
到 站 MELOYEBE . 苛 a 放 总 王 由 可 守 再。 也 二 其 后 王 ” 


翻译 成 SELECT、PROJECT 及 JOIN 运算 的 序 
列 。 

39. 说 明 对 第 13 题 中 数据 库 实施 以 下 SQL 语 何 后 
的 绍 菏 : 


nmSeLrt 工 mt 上 所 MaANUFECTURER 
VBLUBS Tt COmpanw 过， EBD]t 2 其 .031) 


40. 说 明 对 第 13 题 中 数据 库 实 施 以 下 SQL 语句 后 
的 歼 未 : 


UPQGate MANUFRACTURRR 
号 已 七 “ 尼 避 SEE= , 癌 3 


where CompanyMName = "Company YY 
总 刀 避 下 刀 并 全 aame = 理 口 上 2 避 基 


*41, 请 确定 用 来 维护 杂货 店 库存 的 面 回 对 象 数据 
库 中 的 几 个 对 银 , 并 说 明 每 个 对 象 中 应 该 包含 
哪些 方法 ? 

*+42. 请 确定 用 来 维护 图 书馆 藏书 记录 的 面向 对 银 
数据 库 中 的 几 个 对 银 , 并 说 明 每 个 对 象 中 应 该 
包含 哪些 方法 ? 

*43. 如 果 TI 和 T2 两 个 事务 按 如 下 安排 来 调度 , 会 产 

生 什 么 样 的 错误 信息 ? 
T1 设 计 为 计算 账户 A 和 B 总 和 ，T2 设 计 为 从 账 
户 A 转 账 100 美 元 到 账户 B。T1 先 读 取 账户 A 的 
余额 ， 然 后 T2 实 行 转账 ， 最 后 T1 读 取 账 户 B 的 
余额 ， 并 输出 读 得 的 两 个 值 的 总 和 。 

*44. 说 明 怎 样 用 文中 介绍 的 锁定 协议 来 解决 问 
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题 43。 

*45. 第 43 题 中 如 果 T1 是 较 新 的 事务 ， 那 么 受伤 等 
待 协 议会 对 上 述 事 件 序列 起 什么 作用 ? 如 果 
T2 是 较 新 的 事务 ， 结 果 又 如 何 ? 

xd46. 假设 有 一 个 事务 试图 在 一 个 余额 为 200 美 元 的 
账户 中 存 入 100 美 元 ， 同 时 另 一 事务 试图 从 同 
-账户 取出 100 美 元 。 描 述 如 何 通过 这 些 事务 
的 变 叉 处 理 ， 使 得 最 后 余额 为 100 美 元 。 描 述 
如 何 通过 这 些 事务 的 交叉 处 理 , 使 得 最 后 余额 
为 300 美 元 。 
*47. 对 数据 库 中 的 一 个 数据 项 , 一 个 事务 有 互 斥 访 
问 和 有 共享 访问 有 什么 不 同 ? 为 什么 这 种 差 
别 很 重要 ? 
. 9.4 节 讨论 过 的 关于 并 发 事务 的 一 些 问题 不 单 
限于 数据 库 环 境 。 当 用 几 个 字 处 理 程序 来 访问 
同一 个 文档 时 会 产生 怎样 类 似 的 问题 ?《〈 如 果 
你 的 PC 机 中 有 字 处 理 程 序 ， 试 着 激活 两 个 实 
例 来 访问 同一 文档 ， 看 看 会 发 生 什 么 。) 
*#d49. 假定 一 个 顺序 文件 有 50 000 条 记录 ,查询 一 条 
记录 需 $Sms。 请 问 : 检索 一 条 处 在 文件 中 间 部 
位 的 记录 ， 需 要 等 待 多 长 时 间 ? 
. 见 图 9-15 中 的 归并 算法 , 如 果 其 中 一 个 输入 文 
件 一 开始 就 是 空 的 ， 请 列 出 执行 该 算法 的 步 
又 ， 
. 修改 图 9-15 中 的 算法 ， 来 处 理 这样 一 种 情况 : 
两 个 输入 文件 都 包含 一 个 有 同样 键 字 段 值 的 
记录 。 假定 这 些 记录 都 一 样 ,在 输出 文件 里 只 
要 有 一 个 即 可 。 
*2. 设计 一 个 系统 ,利用 这 个 系统 ,存储 在 磁 稻 上 
的 一 个 文件 能 够 作为 顺序 文件 在 两 个 不 同方 
向 上 都 能 进行 处 理 。 

*53. 说 明 如 何 能 够 利用 一 个 文本 文件 作为 基本 结 
构 ， 来 构建 一 个 包含 杂志 订户 信息 的 顺序 文 
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件 。 

*54. 设计 一 种 技术 , 通过 这 种 技术 , 将 逻辑 记录 大 
小 并 不 一 致 的 顺序 文件 用 文本 文件 来 实现 。 例 
如 , 假设 要 构建 一 个 包含 小 说 家 信息 的 顺序 文 
件 , 其 每 条 还 辑 记 录 都 包含 一 个 作家 的 信息 及 
其 作品 清单 。 

*55. 震 引 文件 与 散 列 文件 相 比 ,有 什么 优势 ?而 散 
列 文 件 与 索引 文件 相 比 ， 又 有 什么 优势 ? 
*+56. 本 章 描 述 了 传统 文件 索引 与 由 操作 系统 维护 
的 文件 目录 系统 相似 。 在 哪些 方面 操作 系统 的 

文件 目录 与 传统 索引 不 同 ? 

*57. 如 果 散 列 文件 分 到 10 个 桶 里 ， 那 么 任意 3 条 记 
录 中 的 至 少 2 条 放 进 同一 个 桶 的 概率 是 多 少 
(假定 散 列 函数 不 让 任何 一 个 桶 拥有 优先 
权 ) ? 文件 中 必须 存放 有 多 少 条 记录 ,， 才 可 能 
发 生 磁 撞 ? 

*S8. 假设 六 件 被 分 进 100 个 桶 而 不 是 10 个 桶 ， 重 解 
上 题 。 

*59. 如 果 我 们 利用 本 章 讨 论 过 的 除法 技术 作为 散 
列 函 数 ,并且 将 文件 存储 区 分 成 23 个 桶 ， 那 么 
当 把 键 翻译 为 一 个 二 进 制 值 时 , 应 当 搜寻 哪个 
区 来 寻找 其 键 值 为 整数 124 的 记录 ? 

*60. 通过 比较 散 列 文件 的 实现 与 同 构 二 维 数 组 的 
实现 , 说 明 散 列 函 数 与 地 址 多 项 式 的 作用 有 什 
人 么 关羽 之 处 ? 

*61. 试 给 出 下 列 比较 中 的 一 个 优点 : 

a， 顺序 文件 优 于 索引 文件 。 
b， 顺 订 文 件 优 于 散 列 文件 。 
c. 察 引 文件 优 于 顺序 文件 。 
d. 索引 文件 优 于 般 列 文件 。 
e， 散 列 文 件 优 于 顺序 文件 。 
f 散 列 文件 优 于 索引 文件 。 
*62. 从 哪些 方面 可 以 看 出 顺序 文件 类 似 于 链表 ? 
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下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 这 些 问 题 不 
是 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 
1. 在 美国 ， 所 有 办 犯 的 DNA 记 录 都 存储 在 一 个 数据 库 中 ， 以 备 犯罪 研究 所 用 。 如 果 发 布 这 
些 信 息 发 放 用 于 其 他 用 途 ， 例 如 用 作 医 学 研究 ， 这 样 做 道德 吗 ? 如 果 合 乎 道德 ， 可 用 于 
什么 目的 ? 如 果 不 合 平 道 德 ， 为 什么 ? 而 每 种 情况 的 利 与 整 又 是 什么 ? 
2. 在 怎样 的 程度 上 , 才能 多 许 大 学 公布 其 学 生 的 信息 ? 可 以 公布 他 们 的 姓名 和 地 址 吗 ? 可 以 
在 学 生 不 知情 的 情况 下 公布 他 们 的 成 绩 排名 吗 ? 你 的 看 法 是 否 与 第 1 题 的 回答 一 致 ? 
3. 构建 有 关 个 人 的 数据 库 时 ， 采 取 什么 样 的 限制 比较 合适 ? .政府 有 权 掌 握 公 民 的 什么 信 
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妃 ? 保险 公司 有 权 掌 握 其 客户 的 什么 信息 ? 公司 有 权 掌 握 其 雇员 的 什么 信息 ? 在 这 些 
情况 中 ， 需 要 实行 控制 吗 ? 如 果 需 要 ， 怎 样 实现 ? 

4. 如 采信 用 卡 公司 把 它 的 客户 的 消费 模式 卖 给 商业 公司 ， 这 样 做 是 否 合适 ? 如果 赛车 邮购 
业务 公司 把 它 的 邮购 清单 卖 给 赛车 杂志 ， 这 样 做 是 否 合适 ? 如果 美国 国税 局 把 那些 有 着 
巨额 收入 的 纳税 人 的 姓名 和 地 址 信息 卖 给 股票 经 纪 人 ， 这 样 做 是 否 合适 ? 如果 你 没有 充 
分 的 把 握 回答 是 与 否 ， 那 么 你 有 什么 可 行 的 方案 ? 

5. 数据 库 的 设计 者 对 于 如 何 使 用 数据 库 信息 应 当 负 怎样 的 责任 ? 

6. 假设 数据 库 的 信息 因数 据 库 错 误 而 被 非 授 权 用 户 访问 。 如 果 信 息 被 怀 有 恶意 目的 的 用 户 
获得 和 使 用 ， 那 么 数据 库 设 计 者 应 对 此 承担 何 种 责任 ? 你 的 回答 是 否 与 作恶 者 为 发 现 数 
据 库 设计 调 铀 并 非法 获取 信息 所 花费 的 精力 大 小 有 关 ? 

7. 数据 挖 据 的 盛行 带 来 了 大 量 的 道德 和 隐私 问题 。 如 果 数 据 挖掘 揭示 了 你 所 在 社区 的 所 有 
居民 的 茶 些 特性 ， 那 么 你 的 隐私 是 否 受到 侵犯 ? 数据 挖掘 的 使 用 是 促进 了 商业 的 发 展 还 
慧 或 励 了 让 从 ? 因为 相对 于 个 别 问卷 调查 明确 询问 的 方式 而 言 ， 从 人 口 普查 的 数据 中 能 
提取 更 多 的 信息 ， 那 么 强制 公民 参加 人 口 普查 是 否 合适 昵 ? 数据 挖 据 给 予 商业 公司 的 好 
处 ， 对 于 不 知情 的 客户 来 说 是 否 不 公平 ? 这 样 一 种 状况 的 好 与 坏 ， 到 了 何 种 程度 ? 

8. 可 以 允许 公 司 或 个 人 收集 和 保留 私人 信息 能 够 到 多 大 的 程度 ? 尽管 收集 的 信息 分 散在 
一 尝 发 起 者 之 间 ， 但 是 如 果 这 些 信息 已 经 能 公开 地 获得 ， 那 么 现在 该 怎么 办 ? 公司 或 个 
人 期 望 在 何 种 程度 上 保护 这 类 信息 ? 

9. 许多 疼 书 馆 提供 参考 查询 服务 ， 所 以 读者 在 查阅 信息 时 可 以 得 到 图 书 管理 员 的 帮助 。 因 
特 网 和 数据 库 技术 的 出 现 是 否 会 使 这 种 服务 过 时 ? 如 果 会 ， 那 么 这 是 前 进 了 还 是 倒退 
了 ? 如 采 不 会 ， 为 什么 ? 因特网 和 数据 库 技术 的 存在 对 图 书 管理 员 本 身 有 什么 样 的 影 
啊 ? 

10. 在 何 种 程度 上 ， 你 的 身份 信息 被 暴露 ? 你 会 采取 哪些 步骤 使 暴露 机 会 最 小 ? 如 果 你 的 
个 人 信息 被 窃 ， 对 你 的 伤害 将 有 多 大 ? 发 生 这 种 情况 ， 你 自己 有 责任 吗 ? 
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计算 机 图 形 邓 


章 将 探索 计算 机 图 形 学 领域 ， 这 是 一 个 对 电影 制作 和 交互 式 视频 游戏 具有 重大 影 啊 
的 领域 。 实 际 上 ， 计 算 机 图 形 学 的 发 展 解除 了 视觉 媒体 对 实体 的 依赖 ， 许 多 人 认为 
计算 机 动画 在 不 和 久 的 将 来 会 取代 整个 影视 产业 对 传统 的 演员 、 布 景 和 照片 的 需求 。 
计算 机 图 形 学 是 计算 机 科学 的 分 支 ， 它 应 用 计算 机 技术 创建 和 操控 视觉 表现 。 这 是 一 个 三 
泛 的 课题 ， 它 包括 : 文本 表示 、 图 形 和 图 表 的 创建 、 图 形 化 用 户 界 面 的 开发 、 照 片 的 操作 、 视 
频 游 戏 的 制作 、 影 视 动 画 的 生成 等 。 然 而 ， 术 语 计算 机 图 形 学 愈 来 您 多 地 被 用 来 指 一 个 称 之 为 
3D 图 形 学 的 特定 领域 ， 本 章 大 部 分 内 容 将 集中 在 这 个 主题 上 。 我 们 将 从 定义 3D 图 形 学 开始 ， 盖 
明 它 在 广义 的 计算 机 图 形 学 中 的 作用 。 


1 各 站 前 汪 于 半 让 仙人 让 二 所 且 丰 和 和 天 让 记 攻 二 后 让 和 4 于 全 下 丽人 R 了 生生- 宁 和 站 芋 了 本 用 EPE 语 寺 -了 让 有 证 由 和 下 生生 村 下， 玫 丰 有 计 全 本 本 守卫 下 和 由 秆 生生 HH 二 症 和 光 站 贞 由 


10.1 计算 机 图 形 学 的 苑 围 


随 着 数码 相机 的 出 现 ， 数 字 图 像 处 理 软件 迅速 流行 起 来 。 人 们 可 以 使 用 这 类 软件 通过 去 除 
污点 和 “红眼 ”等 操作 达到 “润色 ”照片 的 目的 ， 也 可 以 在 不 同 的 照片 中 进行 裁 甬 和 粘贴 ， 创 


建 一 幅 并 非 反映 真实 世界 的 图 像 。 


类 似 的 技术 经 常 应 用 于 电影 和 电视 产业 中 ， 以 产生 特效 。 例 如 ， 可 以 很 容易 地 通过 去 除 支 


撑 的 金属 丝 ， 重 登 多 幅 图 像 ， 或 产生 新 的 图 像 序列 帧 等 特效 处 理 ， 改 变 最 官 拍摄 的 情节 。 这 促 


使 影视 产业 据 弃 像 胶 卷 之 类 的 模拟 系统 ， 转 癌 数 字 图 像 。 

除了 处 理 数字 照片 和 视频 的 软件 外 ， 现 在 还 有 各 种 各 样 的 工具 /应 用 软件 包 ， 它 们 帮助 产生 
二 维 图 像 ， 从 简单 的 画 线 到 复杂 的 艺术 。( 一 个 众所周知 的 最 基本 的 例子 就 是 微软 的 “画图 ”应 
用 程序 .) 至 少 ， 这 类 程序 的 基本 操作 包括 : 绘制 点 和 线 、 揪 入 像 椭圆 和 矩形 这 样 简单 的 几何 图 
形 、 给 区 域 填充 颜色 ， 以 及 裁 台 和 粘贴 绘图 的 指定 部 分 。 

注意 ， 上 面 所 有 的 应 用 都 是 处 理 平面 二 维 图 形 和 图 像 的 操作 。 这 里 有 两 个 相关 研究 领域 ， 
一 个 是 2D 图 形 学 (2D graphics)， 另 一 个 是 图 像 处理 〈image processing)。 二 者 的 区 别 在 于 : 2D 
图 形 学 着 重 于 把 二 维 图 形 〈 圆 、 和 矩形 、 文 字 等 ) 转化 为 像素 模式 ， 产 生 图 像 ， 而 图 像 处 理 着 重 
于 分 析 图 像 中 的 像素 ， 进 行 模式 识别 ， 以 达到 增强 或 “理解 ”图 像 的 目的 。 简 言 之 ，2D 图 形 学 
处 理 生 成 图 像 ， 而 图 像 处 理 分 析 图 像 。 

与 2D 几 形 学 中 把 二 维 图 形 转化 为 图 像 相 对 应 ，3D 图 形 学 (3D graphics) 领域 处 理 的 是 把 三 
维 图 形 转化 成 图 像 。 这 个 过 程 是 : 建造 三 维 场景 的 数字 化 版 本 ， 然 后 模拟 照相 的 过 程 ， 产 生 这 
些 场 景 的 图 像 。 这 与 传统 的 摄影 类 他， 不 同 之 处 在 于 场景 是 使 用 3D 图 形 技术 “拍摄 ”出 来 的 ， 
作为 物理 现实 是 不 存在 的 ， 取 而 代 之 的 是 数据 和 算法 的 集合 。 因 此 ，3D 图 形 “ 拍 摄 ” 应 氢 世 和 
《参见 图 10-1)， 而 传统 的 摄影 技术 担 摄 真 实 世 界 。 

需要 注意 的 是 ， 使 用 3D 图 形 创建 图 像 要 经 历 两 个 不 同 的 步骤 :一 个 是 创建 、 编 码 、 存 储 以 
及 操作 被 拍摄 出 来 的 场景 : 力 一 个 是 生成 图 像 的 过 程 。 前 者 是 创造 性 的 、 艺 术 的 过 程 ， 而 后 者 
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则 是 以 计算 为 主 的 过 程 。 这 些 主题 是 我 们 在 下 面 4 个 小 节 中 将 要 讨论 的 。 





图 10-1 使 用 3D 图 形 产 生 的 虚拟 世界 的 “照片 ” (迪士尼 与 皮克斯 合拍 的 《玩具 总 动 
员 》 剧照 ) 四 Corbis/Sygma 


3D 图 形 可 以 制作 出 不 依赖 于 实体 的 虚拟 场景 , 这 使 得 它 非常 适用 于 交互 式 视频 游戏 和 
动画 电影 的 制作 。 交互 式 视频 游戏 由 数字 化 的 三 维 虚 拟 环 境 构成 , 游戏 玩家 与 之 进行 交互 ， 
玩家 看 到 的 图 像 是 通过 3D 图 形 技术 制作 出 来 的 。 动画 电影 是 用 类 似 的 方法 创建 的 , 不 同 之 
处 在 于 只 是 动画 制作 者 与 虚拟 环境 交互 ， 而 公众 看 到 的 则 是 导演 / 片 商 发 布 的 二 维 图 像 帧 
序列 。 

本 书 将 在 10.6 节 中 更 全 面 地 讨论 3D 图 形 学 在 动画 中 的 应 用 。 这 里 可 以 想象 一 下 ， 随 着 3D 名 
形 技术 的 发 展 ， 这 些 应 用 将 可 能 导向 何 处 。 如 今 ， 电 影 是 以 二 维 图 像 序列 发 布 的 。 尽 管 显示 这 
举 信息 的 放映 机 已 经 取得 了 很 大 进步 ， 从 使 用 胶卷 的 模拟 设备 到 使 用 DVD 播放 机 和 平板 显示 器 
的 数字 技术 ， 但 它们 的 显示 仍然 只 是 二 维 的 。 

但 是 ,想象 一 下 当 创建 和 操作 真实 的 三 维 虚拟 世界 的 能 力 得 到 改善 时 ,将 会 发 生 什 么 改变 。 
我 们 将 不 再 仅 能 “拍摄 ”这 些 虚拟 世界 和 以 二 维 图 像 的 形式 发 布 电影 ， 而 且 能 发 布 虚拟 世界 。 
观众 将 不 仅仅 只 能 观看 电影 ， 还 可 以 通过 “3D 图 形 放 映 机 ”来 观看 虚拟 场景 ， 就 像 通 过 专用 的 
“游戏 盒 ” 来 观看 视频 游戏 一 样 。 观 众 可 能 先 看 到 导演 /制造 者 预定 的 “建议 的 情节 ”， 与 此 同时 
还 可 以 与 虚拟 场景 交互 ， 就 像 玩 视 频 游戏 一 样 产生 另外 的 场景 。 在 考虑 到 正在 研发 的 三 维 人 机 
接口 的 潜力 时 ， 这 种 可 能 性 是 很 大 的 。 












图 、2D 图 形 学 和 3D 图 形 学 之 间 的 区 别 。 
> 生 3D 图 形 学 与 传统 摄影 有 何不 同 ? 


3. 应 用 3D 图 形 学 制作 “照片 ”的 两 个 主要 步骤 是 什么 ? 

















本 章 我 们 从 创建 和 显示 图 像 的 整个 过 程 来 开始 对 3D 图 形 学 的 研究 。 这 个 过 程 由 3 步 构成 ; 
建 模 、 演 染 (rendering) 和 显示 。 建 模 〈 将 在 10.3 节 中 详细 介绍 ) 与 传统 电影 产业 中 设计 和 构造 





一 个 场景 类 似 ， 不 同 之 处 在 于 3D 图 形 场景 是 用 数据 结构 和 算法 “构造 ”的 。 这 就 导致 应 用 计算 
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机 图 形 学 产生 的 场景 可 能 在 现实 中 永远 都 不 存在 。 

下 一 步 就 是 通过 计算 场景 中 的 物体 如 何 显示 在 由 特定 位 置 的 相机 拍摄 的 照片 中 ， 来 生成 场 
景 的 二 维 图 像 。 这 称 为 这 染 (rendering) (10.4 节 和 10.5 节 的 主题 ),， 消 染 的 概念 是 运用 解析 几何 ， 
来 计算 场景 中 的 物体 到 一 个 称 为 投影 平面 (projection plane) 的 面 上 会 形成 的 投影 ， 这 种 方式 与 
相机 将 场景 投影 到 胶卷 上 的 方式 类 似 《〈 如 图 10-2 所 示 )。 这 种 投影 称 为 透视 投影 (perspective 
projection)， 在 这 种 投影 方式 下 ， 所 有 的 目标 都 沿 着 一 条 称 为 投影 线 (projector) 的 直线 问 前 延 
伸 ， 这 条 直线 是 从 一 个 称 为 投影 中 心 《center of projection) 或 视点 《view point) 的 会 共 点 延伸 
出 来 的 。( 这 与 平行 投影 (parallel projection) 不 同 ， 顾 名 思 义 ， 平 行 投影 线 是 平行 的 。 透 视 投 
影 产 生 的 投影 类 似 于 人 类 眼睛 所 看 到 的 ， 而 平行 投影 产生 的 是 物体 “真正 ”的 剖面 ， 这 在 工程 
绘图 中 非常 有 用 。) 





图 像 窗 口 动 - _- 一 
4 一 场景 中 的 物体 
投影 线 人 
< 物体 在 投影 平 
LE 和 面 上 的 图 像 
投影 中 心 AS 


图 10-2 3D 图 形 学 范例 


对 于 用 来 定义 最 终 图 像 边 界 的 投影 平面 ， 其 中 受 限 的 部 分 称 为 图 像 窗 口 (image window )。 
它 对 应 于 显示 在 大 多 数 相 机 取景 器 上 的 矩形 ， 指 明 湾 在 图 像 的 边界 。 实 际 上 ， 大 多 数 相 机 的 取 
景 器 多 许 用 户 看 到 相机 投影 平面 上 更 大 的 区 域 ， 而 不 仅仅 是 图 像 窗 口 .( 你 可 能 会 在 取景 器 中 看 
到 “Aunt Martha” 的 头 的 上 方 ， 但 是 ， 除 非 这 部 分 影像 也 出 现在 图 像 窗 口中 ， 和 否则 和 它 就 不 会 出 
现在 最 终 图 像 中 。) 

一 且 投 影 到 图 像 窗口 的 场景 确定 ， 束 可 以 计算 出 最 终 图 像 上 的 每 个 像素 点 的 显示 情况 ， 这 
种 逐个 像素 的 计算 过 程 可 能 会 很 复杂 ,因为 它 需 要 确定 场景 中 的 物体 如 何 与 光线 融合 。( 在 明亮 
光线 下 硬是 有 光泽 的 表面 与 在 间接 光线 下 软 且 透 明 的 表面 ， 二 者 的 泻 染 方法 应 该 有 所 不 同 .) 因 
此 ， 演 染 处 理 涉 及 包括 材料 科学 和 物理 学 在 内 的 许多 其 他 研究 领域 。 而 且 ， 在 决定 一 个 物体 的 
显示 效果 时 经 党 需要 了 解 场景 中 的 其 他 物体 。 这 个 物体 可 能 处 在 另 一 个 物体 的 阴影 中 ， 或 者 这 
个 物体 是 镜子 ， 它 的 显示 实质 上 就 是 其 他 物体 。 

当 确 定 了 每 个 像素 的 显示 方式 后 ， 结 果 被 集中 地 表示 成 图 像 的 位 图 ， 并 存储 在 称 为 帧 缓冲 
区 (〈frame buffer) 的 存储 区 域 中 。 这 个 缓冲 区 可 能 是 主 存 中 的 一 个 区 域 ， 或 当 有 专门 处 理 图 形 
应 用 的 硬件 时 ， 它 可 能 是 专用 存储 电路 中 的 一 个 块 。 

最 后 ， 存 储 在 帧 缓冲 区 的 图 像 或 者 为 了 观看 而 显示 ， 或 者 为 以 后 的 显示 而 传送 给 更 永和 的 
存储 器 。 如 果 生 成 的 图 像 将 用 于 电影 画面 ， 那 它 可 能 在 最 终 显 示 前 被 存储 或 者 甚至 是 被 修改 。 
但 是 ， 在 交互 式 视频 游戏 或 飞行 模拟 器 中 ， 图 像 必 须 显 示 ， 因 为 它们 是 在 实时 基准 上 生成 的 ， 
这 个 要 求 经 党 限制 了 图 像 的 质量 。 这 就 是 由 制 片 厂 发 布 的 全 特征 动画 产品 的 图 像 质量 要 超过 当 
今 交 互 式 视频 游戏 中 的 图 像 质 量 的 原因 。 
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最 后 ， 我 们 通过 分 析 一 个 典型 的 视频 游戏 系统 来 结束 对 3D 图 形 的 介绍 。 这 个 游戏 实际 上 珊 
是 一 个 数字 化 虚拟 世界 的 软件 ， 它 允许 游戏 玩家 操控 这 个 虚拟 世界 。 当 玩家 操控 这 个 世界 时 ， 
游戏 系统 会 不 断 地 演 染 场景 并 把 图 像 存储 到 图 像 缓冲 区 中 。 为 了 克服 真实 世界 的 时 间 限 制 ， 六 
多 数 滨 染 处 理 都 是 由 专用 硬件 来 实现 的 。 实 际 上 ， 正 是 这 些 硬 件 使 游戏 系统 和 一 般 个 人 计算 机 
之 间 有 了 显著 差别 。 最 后 ， 游 戏 系统 中 的 显示 设备 显示 了 帧 缓冲 区 中 的 内 容 ， 给 玩家 以 变化 声 
景 的 幻觉 。 


问题 与 练习 

1. 总 结 在 使 用 3D 图 形 生 成 图 像 时 涉及 的 3 个 步 坚 ， 
2 投影 平面 和 图 像 窗 口 之 间 有 何不 同 ? 

3. 什么 是 帧 缓冲 区 ? 


En HT 
和 


3D 计 算 机 图 形 投影 的 起 始 阶段 与 戏剧 舞台 制作 方式 十 分 相似 : 必须 设计 出 布景 ， 收 集 到 或 
者 搭建 所 需 的 道具 。 在 计算 机 图 形 学 的 术语 中 , 布景 称 为 场景 (scene)， 道具 称 为 物体 (object)。 
记 住 3D 图 形 场 景 是 虚拟 的 ， 因 为 组 成 它 的 物体 是 由 数字 化 模型 “构建 ”而 成 ， 并 不 是 实际 的 物 
理 结构 。 

本 节 将 探讨 与 “构建 ”物体 和 场景 有 关 的 话题 。 我 们 以 单个 物体 的 建 模 问 题 开 始 ， 并 以 考 
虑 集中 这 些 物体 以 形成 场景 这 个 任务 结束 。 


10.3.1 单个 物体 的 建 模 


在 舞台 制作 中 ， 道 具 的 真实 程度 取决 于 它 在 场景 中 的 使 用 方式 。 我 们 可 能 不 需要 一 辆 完整 
的 汽车 ， 电 话 并 不 需要 能 用 ， 背 景 可 能 也 只 是 画 在 大 背景 屏幕 上 的 。 同 样 ， 就 计算 机 图 形 学 而 
言 ， 一 个 物体 的 软件 模型 能 否 准确 地 反映 物体 真实 属性 的 程度 依 赖 于 情境 的 需要 。 前 景物 体 的 
建 模 与 背景 中 的 物体 相 比 需要 考虑 更 多 的 细 斑 。 和 而 且 ， 在 那些 没有 严格 实时 限制 的 情况 下 ， 会 
产生 更 多 的 细节 。 

因此 ， 一 些 物体 模型 可 能 相对 简单 ， 而 另 一 些 可 能 极其 复杂 。 作 为 一 个 通用 规则 ， 模 型 越 
精确 ， 图 像 的 质量 越 高 ， 泻 染 所 需要 的 时 间 也 就 越 长 。 因 此 ， 现 在 进行 的 大 多 数 对 于 计算 机 镜 
形 学 的 研究 都 是 在 寻求 一 种 开发 技术 ， 以 构建 更 精细 ， 同 时 也 是 高 效 的 物体 模型 。 这 些 研究 中 
有 些 涉 及 开发 模型 ， 开 发 模型 依据 物体 在 场景 中 的 最 终 作用 来 提供 不 同 的 细节 层次 ， 这 梓 可 以 
在 变化 的 场景 中 重用 同一 个 物体 模型 。 
描述 一 个 物体 所 需 的 信息 包括 ， 物 体 的 形状 ， 以 及 额外 的 特性 【如 决定 物体 如 何 与 光 区 互 

的 表面 特性 等 )。 现 在 ， 让 我 们 考虑 形状 建 模 这 个 任务 。 

1. 形状 

在 3D 图 形 中 物体 的 形状 通常 描述 成 称 为 平面 片 (planar patch) 的 小 平面 的 集合 ， 其 中 每 一 
个 都 是 一 个 多 边 形 。 这 些 多 边 形 形成 了 多 边 形 网 格 (polygonal mesh)， 它 近似 于 被 描述 的 物体 
形状 〈 如 图 10-3 所 示 )。 通 过 使 用 小 平面 片 ， 近 似 可 以 达到 所 需要 的 精确 度 。 

多 边 形 网 格 中 的 平面 片 经 常 选择 为 三 角形 ,因为 每 个 三 角形 能 用 它 的 3 个 顶点 来 表示 , 这 是 
在 三 维 室 间 中 确定 一 个 平面 所 需 的 最 少 点 的 数目 。 在 任何 情况 下 ， 多 边 形 网 格 都 表示 成 这 些 平 
面 片 顶点 的 集合 。 
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图 10-3 ” 球 的 和 多边 形 网 格 


一 个 物体 的 多 边 形 网 格 表示 可 以 通过 多 种 途径 获得 。 其 中 一 种 是 : 以 所 需 形 状 的 精确 的 几 
何 描述 开始 ， 然 后 用 这 些 描述 构建 多 边 形 网 格 。 例 如 ， 解 析 几 何 中 半径 为 r 的 球 〈 中 心 在 原点 ) 
用 方程 来 描述 ， 

闫 一 好 十 冯 十 字 

基于 这 个 公式 ， 我 们 可 以 确立 球 上 经 线 和 纬 线 的 方程 ， 标 识 这 些 线 的 交叉 点 ， 然 后 使 用 这 
些 点 作为 和 多边形 网 格 中 的 顶点 。 类 似 的 技术 可 以 应 用 到 其 他 传统 的 几何 形状 上 ， 这 就 是 为 何在 
廉价 的 计算 机 动画 中 人 物 角 色 经 常 显示 为 球 、 圆 柱 体 和 锥 体 这 些 结构 拼 读 的 原因 。 

更 一 般 的 形状 可 以 用 更 复杂 的 分 析 方法 来 描述 。 其 中 一 种 方法 是 使 用 贝 塞 尔 曲线 (Bezier 
curve)〔 以 皮尔 。 贝 塞 尔 命名 ， 他 在 19 世 纪 70 年 代 早期 提出 了 这 个 概念 ， 当 时 他 是 雷诺 汽车 公 
司 的 工程 师 ), 它 允 许 在 三 维 空间 中 只 用 几 个 称 为 控制 点 的 点 来 定义 曲线 段 (其 中 有 两 个 点 表示 
曲线 段 的 端点 ， 而 其 他 的 点 则 指出 曲线 的 弯曲 方式 )。 例 如 ， 图 10-4 显 示 了 由 4 个 控制 点 定义 的 曲 
线 。 注 意 ， 曲 线 显 示 为 弯 向 两 个 不 为 端点 的 控制 点 。 通 过 移动 这 些 点 ， 曲 线 可 以 被 扭曲 成 不 同 的 
形状 。( 你 可 能 曾经 用 过 像 微软 的 画图 这 样 的 绘图 软件 包 构 建 曲 线 。) 尽管 我 们 在 这 里 不 再 继续 探 
讨 这 个 话题 ， 但 描述 曲线 的 贝 塞 尔 技 术 可 以 扩展 为 描述 三 维 曲 面 ， 称 为 贝 塞 尔 曲 面 (Bezier 
surface)。 因 此 , 对 于 复杂 表面 , 在 获得 多 边 形 网 格 的 过 程 中 ， 贝 塞 尔 曲 面 被 证 明 是 高 效 的 第 一 步 。 


标识 曲线 端点 的 控制 点 


一 一 一 用 沫 扭曲 曲线 的 控制 点 


图 10-4 贝 塞 尔 曲线 


你 可 能 会 问 为 什么 需要 把 形状 的 精确 描述 〈 如 球 的 简明 公式， 或 描述 贝 塞 尔 表面 的 公式 ) 
转化 为 使 用 多 按 形 网 格 的 近似 摘 述 。 答 案 是 用 多 人 按 形 网 格 表 示 所 有 物体 的 形状 确立 了 泻 梁 处理 
的 统一 方法 一 可 以 更 高 效 地 演 染 整个 场景 的 技巧 。 这 样 ， 尽 管 几 何 公式 提供 了 形状 的 精确 描 
述 ， 但 它们 只 是 作为 构建 多 边 形 网 格 的 工具 。 

另外 一 种 获得 多 边 形 网 格 的 方法 是 用 蛮 力 的 方式 构建 网 格 。 在 无 法 用 完善 的 数学 技术 表示 
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形状 的 情况 下 ， 这 种 方法 就 比较 常见 了 。 在 这 个 过 程 中 ， 首 先 构 建物 体 的 物理 模型 ， 然 后 用 类 
笔 设 备 触 摸 表 面 ， 记 录 下 模型 表面 点 的 位 置 ， 这 种 笔 设 备 能 记录 它 在 三 维 室 间 中 的 位 置 ， 此 过 
程 就 称 为 数字 化 〈digitizing)。 然 后 将 获得 的 点 的 集合 用 作 顶 点 ， 从 而 获得 所 描述 形状 的 多 边 形 
网 格 。 

遗 央 的 是 ， 有 些 形 状 非常 复杂 ， 难 以 用 几何 建 模 或 手工 数字 化 获得 真实 模型 。 这 些 例子 包 
揪 : 复杂 植物 结构 《比如 树 )、 复 杂 地 形 【〈 比 如 山脉 )， 以 及 云 、 烟 、 火 苗 等 气态 物质 等 。 在 这 
些 情 况 下 ， 多 边 形 网 格 可 以 通过 编写 自动 构建 所 需 形 状 的 程序 来 获得 。 这 样 的 程序 统称 为 程序 
化 模型 (procedural model)。 换 言 之 ， 程 序 化 模型 是 应 用 算法 产生 所 需 结构 的 程序 单元 。 

例如 ， 通 过 执行 下 列 步骤 ， 程 序 化 模型 被 用 来 产生 山脉 : 以 一 个 三 角形 开始 ， 标 识 三 条 边 
的 中 点 〈 如 图 10-S$a 所 示 ); 然后 连结 这 些 中 点 ， 形 成 4 个 较 小 的 三 角形 〈 如 图 10-$b 所 示 ); 现在 
在 把 原 三 角形 的 3 个 顶点 固定 住 的 同时 ， 在 三 维 空间 里 移动 中 间 点 〈 人 允许 三 角形 的 边线 延长 或 缩 
得 )， 扭 曲 三 角形 的 形状 〈 如 图 10-$c 所 示 ); 对 于 每 个 较 小 的 三 角形 重复 这 个 过 程 〈 如 图 10-5d 
所 示 )， 继 续 重复 这 个 过 程 ， 直 到 达到 所 需 的 精度 。 


a. 标识 中 点 





图 10.5 产生 一 个 山脉 的 多 边 形 网 格 - 
在 上 文中 描述 了 用 程序 化 模型 构建 山脉 (参见 图 10-5$ )， 这 是 分 形 在 3D 图 形 中 起 作用 的 - 


例子 。 从 技术 上 讲 ， 分 形 (fractal ) 是 “Hausdorff 维 度 大 于 其 拓扑 维度 ”的 几何 物体 ， 直 观 
上 讲 , 这 意味 着 物体 是 通过 低 维度 物体 的 副本 “打包 ”而 形成 的 .( 想象 一 下 宽度 就 是 通过 “ 打 
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ta 


> 
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包 ” 多 条 平行 线段 而 创建 的 。) 分 形 通常 是 使 用 递归 过 程 来 形成 的 ， 而 在 递归 中 的 每 个 处 理 就 
是 重复 “打包 ”另外 用 来 建立 分 形 模式 (更 小 ) 的 副本 。 分 形 的 结果 是 其 每 个 部 分 都 征 自 相 
似 的 ， 当 放大 时 ， 它 显示 为 自身 的 副本 。 

分 形 的 一 个 传统 的 示例 就 是 科 赫 雪花 ， 它 是 通过 重复 地 用 相同 结构 的 较 小 版 本 替换 结构 


中 的 直 钱 段 而 形成 的 。 


生成 的 细 化 序列 如 下 所 示 : 


本 


分 形 在 3 图 形 领 域 经 常 是 程序 化 模型 的 主干 . 实际 上 , 它们 已 经 被 用 来 生成 逼真 的 山脉 、 
蔬菜 、 云 和 烟 的 图 像 . 


程序 化 模型 提供 了 一 种 有 效 的 方法 ， 来 产生 多 个 相似 而 又 独特 的 物体 。 例 如 ， 一 个 程序 化 
模型 可 以 用 来 构建 各 种 各 样 的 逼真 的 树 。( 虽然 相似 ， 但 每 棵 树 都 有 上 自己 的 分 文 结构 。) 构建 这 
些 树 模型 的 一 种 方法 是 应 用 分 文 规则 ， 即 用 与 词法 分 析 器 《参见 6.4 节 ) 按 语 法 规则 构建 词法 分 
析 树 非常 相似 的 方法 来 “生成 ” 树 。 事 实 上 ， 在 这 些 情况 下 使 用 的 分 支 规则 的 集合 经 常 被 称 为 
语法 。 一 个 语法 可 能 被 用 来 “生成 ”松树 ， 而 另外 一 个 可 能 用 来 “生成 ”橡树 。 

另 一 种 构建 程序 化 模型 的 方法 是 将 物体 的 基础 结构 模拟 为 一 个 大 的 粒子 集合 。 这 种 模型 称 
为 粒子 系统 (particle system)。 粒 子 系统 通 肖 会 应 用 某 些 预定 义 的 规则 去 移动 系统 中 的 粒子 (或 
许 所 用 的 方式 会 让 人 想起 分 子 的 区 互 ) 来 生成 万 需 的 形状 。 例 如 ， 粒 子 系统 已 经 被 用 来 生成 水 
面 晃 动 的 动画 ， 我 们 将 在 后 面 的 动画 讨论 中 看 到 。( 想 象 一 下 ， 把 一 桶 水 建 模 为 一 桶 玻璃 弹子 ， 
当 棚 益 动 时 ， 玻璃 并 了 也 随 之 四 处 翻滚 ， 梧 拟 水 的 运动 。) 粒子 系统 应 用 的 革 他 例 了 包括 : 火苗 
的 闪烁 、 云 、 拥 挤 的 人 和 群 场景 等 。 

程序 化 模型 的 输出 通常 是 近似 于 物体 形状 的 多 边 形 网 格 。 在 某 些 情况 下 ， 如 使 用 三 角形 生 
成 山脉 ,网 格 就 是 生成 过 程 的 自然 结果 。 在 另外 一 些 情 况 下 ， 如 应 用 分 文 规则 生成 树 ， 网 格 可 
能 就 是 额外 的 、 最 终 的 步骤 。 例 如 ， 在 粒子 系统 中 ， 系 统 外 边沿 上 的 粒子 自然 会 被 选 作 最 终 铬 
边 形 网 格 中 的 顶点 。 

由 程序 化 模型 生成 的 网 格 的 精度 视 具体 情况 而 定 。 在 场景 中 ， 用 于 背景 中 的 树 的 程序 化 模 
型 可 能 只 要 产生 一 个 反映 树 基本 形状 的 粗糙 的 网 格 ， 而 前 景 中 的 树 的 程序 化 模型 就 要 产生 能 分 
清 各 个 校 叶 的 网 格 。 

2. 表面 特征 

仅 由 和 多边形 网 格 构成 的 模型 只 捕获 了 物体 的 形状 。 大 多 数 演 染 系 统 能 在 演 妆 过 程 中 丰富 这 
些 模 型 ， 根 据 用 户 的 需求 展现 各 种 表面 特征 。 例 如 ， 通 过 使 用 不 同 的 着 色 技 术 〈 我 们 将 在 10.4 
节 分 绍 )， 用 户 可 以 指定 球 的 多 边 形 网 格 被 演 染 成 光滑 的 红 球 或 是 粗糙 的 绿 球 。 在 某 些 情况 下 ， 
这 种 灵活 性 是 可 以 做 到 的 。 但 在 需要 如 实 演 染 原始 物体 的 情况 下 ， 关 于 物体 的 更 具体 的 信息 必 
须 包 含 在 模型 中 ， 这 样 泻 染 系统 才 会 知道 该 干什么 。 

除了 形状 之 外 ,还 有 多 种 有 关 物 体 信 息 的 数字 化 技术 。 例 如 ， 沿 着 多 边 形 网 格 的 每 个 顶点 ， 
大 们 可 以 在 物体 的 这 一 点 上 指定 原始 物体 的 颜色 。 然 后 在 这 染 过 程 中 用 这 些 信 息 重 新 创建 原始 
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物体 的 外 观 。 

在 其 他 的 例子 中 ， 通 过 称 为 纹理 映射 (texture mapping) 的 处 理 ， 颜 色 模 式 能 与 物体 表面 相 
关联 。 纹 理 映 射 类 似 于 贴 墙 纸 ， 将 一 个 预定 义 的 图 像 与 物体 的 表面 相关 联 。 这 个 图 像 可 能 是 数 
宪 照 片 、 艺 术 家 的 绘画 ， 也 可 能 是 计算 机 生成 的 图 像 。 传 统 的 纹理 图 像 包 括 : 砖 墙 、 人 
表面 和 大 理 石 表面 等 。 

例如 ， 假 设 我 们 需要 对 石 墙 建 模 ， 我 们 可 以 用 描述 长 矩形 体 的 简单 多 边 形 网 格 来 表示 墙 的 
形状 。 利 用 这 些 网 格 ， 我 们 就 能 提供 砖 石 结 构 的 二 维 图 像 。 随 后 ， 在 泻 染 过 程 中 ， 将 这 个 图 像 
映射 到 矩形 体 上 ， 产 生 石 墙 的 外 观 。 更 准确 地 ， 每 当 演 染 处 理 需 要 显示 墙 上 点 的 时 候 ， 它 就 只 
再 显示 砖 石 结 构图 像 中 对 应 的 点 。 

当 应 用 于 相对 平坦 的 表面 时 ， 纹 理 映射 的 效果 最 好 。 如 果 必 须 明 显 地 扭曲 纹理 图 像 去 轿 盖 
这 曲 的 表面 (想象 成 试图 给 一 个 沙滩 气球 贴 墙纸 的 问题 ), 或 者 如 果 纹 理 图 像 完 全 训 着 一 个 物体 ， 
并 引起 了 接 缝 ， 在 接 甸 处 纹理 模式 可 能 不 与 它 本身 融 侣 ， 那 么 结果 看 上 去 会 不 够 逼真 。 不 过 ， 
纹理 映射 已 经 被 证 明 是 一 种 模拟 纹理 的 有 效 方法 ， 它 被 广泛 地 用 在 实时 敏感 的 场合 〈 一 个 基本 
的 例子 就 是 交互 式 视 频 游 戏 )。 

3. 寻求 吝 真 

构建 可 以 产生 逼真 图 像 的 物体 模型 是 一 个 正在 研究 的 课题 , 特别 有 趣 的 是 当前 角色 的 材质 ， 
如 皮肤 、 头 发 、 毛 皮 和 羽 毛 等 。 这 些 研 究 大 多 是 针对 特殊 物质 的 ， 包 括 建 模 和 浑 染 技术 。 例 如 ， 
为 了 获得 人 类 皮肤 的 通 真 模型 ， 有 些 学 者 研究 光 渗 透 到 表皮 和 真皮 层 的 程度 以 及 这 些 层 的 厚度 
对 诺 肤 外 观 的 影响 。 

习 一 个 例子 是 人 类 头发 的 建 横 。 如 果 从 远 距 离 来 看 头发 ， 那 么 传统 的 建 模 技术 就 足够 了 。 
但 是 ， 从 近 距 离 看 ， 头 发 的 显示 将 会 是 一 个 挑战 。 其 中 的 问题 包括 : 半 透 明 的 特性 、 纹 理 的 深 
上 度 、 寻 凋 特性 和 头发 响应 像 风 这 样 的 外 力 的 方式 。 为 了 解决 这 些 棘 手 的 问题 ， 有 些 应 用 程序 转 
向 对 单 根 头发 建 模 。( 这 是 一 个 可 怕 的 任务 , 因为 人 的 头发 根 数 的 数量 级 达到 了 100 000。) 但 是 ， 
更 令 人 人 恢 奇 的 是 有 些 研 究 者 已 经 建立 了 头发 模型 ， 这 个 模型 给 出 了 单 根 头发 的 鳞 状 纹理 、 颜色 
变化 和 机 械 动力 学 特征 等 。 

习 外 一 个 已 经 发 展 到 相当 精确 建 模 程度 的 例子 是 布 的 建 模 。 在 这 个 例子 中 ， 利 用 编织 模式 
的 复杂 细节 ， 来 生成 织物 类 型 〔〈 像 斜纹 布 与 缓 布 ) 之 间 恰 当 的 纹理 差别 。 将 纱 的 细节 特性 与 编 
织 模式 数字 化 组 合 在 一 起 ， 创 建 出 编织 物 的 模型 ， 产 生 逼 真 的 特效 图 像 。 例 如 ， 注 意 在 图 10-6 
中 显示 的 Shrek 袖 子 上 的 细节 〈 还 有 被 Shrek 抱 在 手中 的 猫 Puss in Boots 所 戴 帽子 上 吉 真 的 羽毛 )。 
态 外 ， 还 将 物理 和 机 械 工程 的 知识 应 用 到 计算 织物 材料 图 像 的 单 根 线 上 去 ， 以 说 明 线 的 拉 伸 和 
织物 修 前 方面 的 特性 。 





图 10-6 由 梦 工 厂 SKG 制 作 的 Shrek 2 中 的 场景 〈@ Dreamworks/The Kobal) 
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正如 我 们 所 说 ， 生 成 逼真 图 像 是 一 个 活跃 的 研究 领域 , 它 综合 了 建 模 和 演 染 处 理 中 的 技术 。 
_ 般 来 说 ， 当 取得 进步 时 ， 新 技术 会 首先 应 用 在 那些 不 受 实 时 限制 影响 的 程序 中 ， 如 电影 制 片 
厂 中 的 图 形 软件 ， 在 建 模 / 泻 染 处 理 与 最 终 的 图 像 显 示 之 间 有 着 明显 的 延迟 。 这 些 进步 可 以 通过 
仔细 比较 Disney 的 影片 zoy Story[1999] 中 的 角色 与 最 初 的 人 物 而 观察 到 。 新 近 开发 的 技术 被 用 来 
改善 表示 面部 特征 的 多 边 形 网 格 间 的 接 锋 ， 如 鼻子 与 脸 的 其 他 部 分 的 边界 。 当 这 些 新 的 技术 得 
到 进一步 发 展 并 变 得 更 高 效 时 ， 它 们 就 可 以 应 用 在 实时 系统 中 了 ， 在 这 些 环境 中 的 图 形 质量 也 
得 到 了 改善 。 


10.3.2 ”整个 场景 的 建 模 


一 旦 场景 中 的 物体 已 经 得 到 充分 地 描述 和 数字 化 ， 它 们 就 都 被 赋予 了 场景 内 的 位 置 、 大 
小 和 方向 。 将 这 些 信 息 集 合并 链接 起 来 以 形成 一 个 数据 结构 ， 称 为 场景 图 (scene graph)。 此 
外 ， 场 景 图 还 包含 与 表示 光源 及 相机 的 特殊 物体 的 链接 。 其 中 记录 了 相机 的 位 置 、 方 癌 和 焦 
点 等 特性 。 

因此 ， 生 成 场景 图 类 似 于 在 传统 的 工作 室 中 摄影 。 它 包括 布置 相机 、 灯 光 、 道 具 和 痛 景 。 


_“《 当 按 快门 时 ， 所 有 的 东西 都 对 照片 的 显示 产生 了 影响 。) 所 不 同 的 是 传统 照片 包含 物理 实体 ， 


而 场景 图 包含 的 是 物体 的 数字 化 表示 。 简 而 言 之 ， 场 景 图 描述 的 是 一 个 虚拟 的 世 乔 。 

为 了 强调 场景 图 的 范围 ， 再 次 考虑 图 10-1 中 的 图 像 ， 想 象 一 下 用 来 生成 它 的 场景 图 。 人 物 、 
墙 、 床 单 、 床 柱 、 巴 斯 光 年 〈 太 空 突击 队 员 ) 身后 的 背包 、 窗 子 的 线 脚 、 窗 外 的 树 和 光源 都 以 
各 自 适 当 的 精度 得 到 了 建 模 ， 并 表示 在 场景 图 中 。 事 实 上 ， 最 初 你 可 能 把 物体 看 成 单个 的 结构 ， 
如 Woody〈 和 牛仔 玩偶 )， 但 实际 上 它们 在 场景 图 中 是 聚集 在 一 起 的 。 

场景 中 相机 的 位 置 会 对 图 像 产 生 很 大 的 影响 。 正 如 先前 提 到 的 ， 物 体 被 建 模 的 精度 依 顿 于 
物体 在 场景 中 的 位 置 。 前 景物 体 比 背景 物体 需要 更 精确 的 建 模 ， 前 景 和 背景 的 区 分 依 顿 于 相机 
的 位 置 。 如 果 使 用 的 场景 环境 类 似 于 戏剧 舞台 布景 ， 那 么 前 景 和 背景 就 很 好 区 分 ， 物 体 模 型 也 
能 被 相应 地 构建 。 但 是 ， 如 果 环 境 要 求 ， 对 于 不 同 的 图 像 相 机 的 位 置 是 改变 的 ， 那 么 由 物体 使 
型 提供 的 精度 就 需要 在 “照片 ” 间 进 行 调整 ， 这 是 当前 研究 的 一 个 领域 。 一 种 方法 是 想象 场景 
是 由 “智能 ”模型 构成 ， 当 相机 在 场景 中 移动 时 ， 这 些 模型 重新 修改 了 它们 的 多 边 形 网 格 和 其 
他 特性 。 

移动 相机 情景 的 一 个 有 趣 的 例子 发 生 在 虚拟 现实 系统 中 ， 用 户 可 以 借助 它 来 体 验 在 虚拟 的 
三 维 世 界 里 走 来 走 去 的 感觉 。 虚 拟 的 世界 用 场景 图 表示 ,而 人 通过 操控 相机 来 观察 其 中 的 场景 。 
实际 上 ， 为 了 提供 三 维 的 深度 感觉 ， 可 以 使 用 两 个 相机 : 一 个 表示 人 的 右 眼 ， 另 一 个 表示 人 的 
左 眼 。 通 过 显示 由 每 只 眼睛 前 的 相机 获得 的 图 像 ， 人 们 产生 了 居住 在 三 维 场景 中 的 幻觉。 当 在 
体验 中 增加 声音 和 触觉 时 ， 这 种 幻觉 就 变 得 十 分 逼真 。 

最 后 ， 我 们 应 该 注意 到 场景 图 的 构建 在 3D 图 形 处 理 里 非常 重要 。 因 为 它 包含 了 生成 最 终 图 
像 所 需 的 所 有 信息 ， 它 的 完成 标志 着 艺术 建 模 的 终止 和 计算 为 主 的 图 形 演 染 的 开始 。 实 际 上 ， 
一 旦 场景 图 被 建立 ， 图 形 学 的 任务 就 变 成 了 计算 投影 、 确 定 特定 点 的 表面 精度 和 模拟 光 效 。 这 
些 任务 在 很 大 程度 上 与 特定 的 应 用 无 天 。 


问题 与 练习 

1. 下 面 是 4 个 点 〈 使 用 传统 的 直角 坐标 系统 编码 ) ， 实 们 表示 平面 片 的 顶点 。 描 述 面 片 的 形状 。“〈 对 于 
没有 解析 几何 背景 知识 的 人 , 每 个 三 元 组 表示 从 房间 中 的 一 个 角落 如 何 到 达 问 题 中 的 基 码 吉 。 第 一 个 
数 表示 沿 着 地 板 和 位 于 你 右 过 的 墙 之 向 的 接 缝 走 多 远 ; 第 二 个 数 表 示 沿 与 位 于 你 左边 的 择 王 有 有 的 方 问 
上 向 房间 里 走 多 远 ， 第 三 个 数 表 示 从 地 板 向 上 有 由 志高 。 如 果 有 一 个 数 是 负数 ， 你 将 不 得 不 扮 成 一 个 幽 


灵 ， 可 以 罕 过 墙 和 地 板 ，) 
公信 0 全 TS 
2. 什么 是 程序 化 模型 ? 
3. 列 出 一 些 在 生成 一 个 公园 图 像 的 场景 图 中 可 能 出 现 的 物体 。 
4. 尽管 可 以 用 几何 方程 更 精确 地 表示 形状 ， 为 什么 要 用 多 边 形 网 格 来 雪 示 ? 
5. 什么 是 纹理 映射 ? 


诞 贡 有 


现在 让 我 们 考虑 浑 染 处 理 ， 它 决定 了 当场 景 图 中 的 物体 投影 到 投影 平面 时 ， 将 如 何 显示 。 
有 儿 种 方法 可 以 完成 演 染 任务 。 这 一 节 集 中 讨论 当今 “消费 者 市 场 ”上 流行 的 图 形 系 统 〈 视 频 
游戏 、 家 庭 计算 机 等 ) 所 使 用 的 传统 方法 。 下 一 节 将 讨论 其 他 两 个 可 供 选 择 的 解决 方案 。 

首先 探讨 光 和 物体 间 交 互 的 一 些 背景 信息 。 人 毕竟, 物体 的 显示 是 由 从 物体 发 出 的 光 决 定 的 ， 
因此 决定 物体 的 显示 这 一 任务 最 终 变 成 了 对 光 的 特性 的 模拟 。 


10.4.1 光一 表 面 交 互 


依 顿 于 物体 的 材料 特性 ， 照 射 到 其 表面 的 光 可 能 被 吸收 ， 从 表面 反弹 成 反射 光 ， 或 穿 过 表 
面 〈《 被 弯曲 ) 成 折射 光 。 

1. 反射 

让 我 们 考虑 从 一 个 平坦 不 透明 表面 反射 的 光线 。 光 线 沿 直线 传播 ， 以 一 个 角度 照射 到 表面 
上 ， 这 个 角度 称 为 入 射 角 (incidence angle)。 光 线 的 反射 角 与 入 射 人 朋 相 同 ， 如 图 10-7 所 示 。 这 些 
估 度 是 相对 于 垂直 于 表面 的 线 〈 即 法 线 (normal)) 来 测量 的 。( 垂 直 于 表面 的 线 经 常 简单 地 雪 
示 为 “法 线 ”， 这 样 就 可 以 说 “入 射 角 是 相对 于 法 线 度量 的 ”%. ) 入 射 光 线 、 反 射 光线 和 法 线 在 同 
一 个 平面 中 。 

如 宋 表 面 是 光滑 的 ， 在 相同 区 域 照射 到 表面 的 平行 光线 〈 如 那些 来 自 同一 光源 的 光线 ) 就 
会 以 相同 的 方向 反射 ， 并 以 平行 光线 离开 物体 。 这 些 反 射 光 称 为 镜面 反射 光 (specular light)。 
注意 ， 只 有 当 反 射 光 是 在 观察 者 的 方向 上 才能 观察 到 镜面 反射 光 。 它 通常 显示 为 表面 上 明亮 的 
高 之 区 。 而 且 ， 因 为 镜面 反射 光 与 表面 的 接触 时 间 最 短 ， 这 使 它 非常 接近 原始 光源 的 颜色 。 


光源 “法 线 
| 
| 
| 


图 10-7 反射 光 


但 征 ， 物 体 表 面 很 少 是 完全 光滑 的 ， 因 此 许多 光线 在 表面 照射 点 的 方向 会 与 大 多 数 表面 的 
个 同 。 而 且 ， 光 线 经 常 穿 透 表面 邻接 的 边界 ， 在 表面 的 粒子 间 跳 弹 ， 最 后 以 反射 光线 离开 。 结 
未 征讨 多 郊 线 将 向 不 同 的 方向 散 开 。 这 散 开 的 光 称 为 散射 光 (diffuse light)。 与 镜面 反射 光 不 同 ， 
若 射 光 在 一 定 范围 的 方向 内 是 可 见 的 。 此 外 ， 散 射 光 与 表面 的 接触 时 间 长 ， 更 容易 受 材料 吸收 
特性 的 影响 ， 因 此 它 更 接近 物体 的 颜色 。 

图 10-8 表 示 了 一 个 被 单个 光源 照射 的 球 ， 球 上 明亮 的 高 亮 区 是 镜面 反射 光 产生 的 ， 通 过 散射 


想 


目 
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光 ， 可 以 看 见面 向 光源 的 半球 的 其 他 部 分 。 注 意 ， 球面 背 着 主 光 源 的 半球 通过 从 光源 直接 被 芭 射 
的 光 是 不 可 见 的 。 球 的 这 部 分 能 够 被 看 见 是 由 于 环境 光 (ambient light) 的 存在 ， 它 是 “漂泊 ”或 
散 开 的 光 , 不 与 任何 特定 的 光源 或 方向 相关 联 。 被 环 壕 光照 射 的 表面 部 分 经 常 显示 为 统一 的 深 色 。 





镜面 反射 光 


族 射 光 一 一 





图 10-8 ”镜面 反射 光 与 散 射 花 


大 多 数 物 体 表 面 既 反射 镜面 反射 光 又 反射 散射 光 ， 表 面 的 特性 决定 了 镜面 反射 光 和 散射 光 
的 比例 。 平 滑 表面 显示 为 发 亮 的 原因 在 于 ， 它 们 反射 的 镜面 反射 光 多 于 散射 光 ， 粗 糙 表 面 显 示 
为 发 暗 是 因为 它们 反射 的 散射 光 多 于 镜面 反射 光 。 而 且 ， 由 于 某 些 表面 具有 细微 的 特性 ， 入 射 
光 的 方向 不 同 ， 镜 面 反 射 光 和 散射 光 的 比例 也 会 有 所 不 同 ， 从 一 个 方向 入 射 的 光照 射 到 这 样 的 
表面 上 可 能 反射 的 主要 是 镜面 反射 光 ， 而 从 另 一 个 方向 入 射 的 光照 射 到 这 个 表面 上 反射 的 主要 
是 散射 光 。 因 此 ， 当 它 旋 转 时 ， 表 面 的 外 观 将 从 明亮 变化 为 灰暗 。 这 种 表面 称 为 各 向 异性 表面 
(anisotropic surface)， 不 同 于 各 向 同性 表面 (isotropic surface)， 后 者 的 反射 模式 是 对 称 的 。 各 
向 异性 表面 的 例子 可 以 在 织物 中 找到 (如 给 子 ), 其 中 织物 的 细毛 根据 它 的 朝向 改变 材料 的 外 观 。 
另外 一 个 例子 是 运动 场 的 草地 表面 ， 那 里 草 的 生长 〈 通 常 是 草 被 裁 前 的 方式 决定 的 ) 产生 了 各 
向 异性 视觉 效果 ， 如 同 明暗 相间 的 条 纹 图 案 。 

2. 折射 

现在 考虑 这 种 情况 ， 光 照射 到 透明 的 物体 上 ， 而 非 遮光 的 物体 上 。 在 此 种 情况 下 ， 放 线 是 
穿 过 物体 而 并 非 从 其 表面 反射 出 去 。 当 光线 穿 透 表面 时 ， 它 们 的 方向 改变 了 ， 这 种 现象 称 为 折 
射 〈refraction)〔〈 如 图 10-9 所 示 )。 折 射程 度 是 由 相关 材料 的 折射 率 决 定 的 。 折 射 率 与 材料 的 密 
度 有 关 。 高 密度 材料 往往 比 低 密度 材料 具有 更 高 的 折射 率 。 当 光线 进入 到 折射 率 更 高 的 材料 中 
时 《如 从 空气 进入 水 中 )， 它 在 入 射 点 处 向 靠近 法 线 的 方向 弯曲 : 如 果 光 线 进 入 到 折射 率 较 低 的 
材料 中 ， 它 将 向 远离 法 线 的 方 癌 索 曲 。 







aa 直 
材料 间 的 边界 


折射 和 朋 折射 光线 


图 10-9 ”折射 光 


10.4 注 染 313 


为 了 准确 地 泻 染 透明 物体 ， 演 染 软件 必须 知道 相关 材料 的 折射 率 ， 但 这 还 不 够 ， 演 染 软 件 
还 必须 知道 物体 表面 的 哪 一 边 表示 为 物体 的 里 面 ， 而 另 一 边 为 外 面 。 光 线 是 进入 物体 还 是 离开 
物体 ? 获得 这 些 信 息 的 技术 有 时 相当 微妙 。 例 如 ， 如 果 规 定 ， 从 外 部 观察 物体 的 时 候 ， 总 是 按 
逆 时 针 顺 序 将 多 边 形 网 格 中 多 边 形 的 顶点 依次 存放 在 一 个 列表 中 ， 那 么 通过 给 出 的 列表 ， 我 们 
可 以 很 容易 地 得 知 面 片 的 哪 一 边 表示 物体 的 外 面 。 48 


10.4.2” 裁 草 、 扫 描 转 换 和 隐藏 面 的 消除 


现在 硝 重 考虑 从 场景 图 生成 图 像 的 过 程 。 目 前 使 用 的 方法 正 是 在 大 多 数 交 互 式 视频 游戏 系 
统 中 使 用 的 技术 。 综 合 应 用 这 些 技 术 ， 形 成 了 一 个 效果 较 好 的 方法 ， 称 为 泻 染 流水 线 (rendering 
pipeline)。 在 本 三 的 末尾 我 们 将 考虑 这 种 方法 的 一 些 优 缺 点 ， 在 10.5 节 将 探讨 两 种 候选 的 方法 。 
值得 一 提 的 是 ， 演 染 流水 线 处 理 不 透明 物体 非常 有 效 ， 因 为 它 不 需要 考虑 折射 的 问题 。 而 且 ， 
它 忽 略 了 物体 间 的 相互 影响 ， 因 此 现在 我 们 就 不 必 担 心 镜像 和 阴影 问题 。 

泻 染 流水 线 首 先 确定 包含 相机 能 “看 到 ”的 物体 〈 或 部 分 物体 ) 的 三 维 场景 的 区 域 。 这 个 
区 域 称 为 规 体 〈view volume)， 它 是 角 锥 内 的 一 个 空间 ， 这 个 角 锥 是 由 从 投影 中 心 出 发 向 图 像 
窗口 边界 延伸 的 直线 所 定义 的 《如 图 10-10 所 示 )。 


让 


视 体 


图 像 窗 


投影 中 心 只 有 视 体内 的 物体 部 分 
才 会 显示 在 图 像 窗口 中 


图 10-10 确定 在 视 体 里 面 的 场景 区 域 


一 旦 视 体 被 确定 ， 接 下 来 就 不 用 考虑 那些 与 视 体 不 相交 的 物体 或 物体 部 分 了 。 毕 竟 ， 那 部 
分 的 场景 投影 将 落 在 图 像 窗 口 的 外 面 ， 因 此 不 会 出 现在 最 终 的 图 像 中 。 第 一 步 就 是 去 除 完 全 在 [452 
视 体外 面 的 物体 。 为 了 能 够 以 流水 线 的 形式 进行 处 理 ， 可 以 将 场景 图 看 作 一 个 树 型 结构 ， 其 中 
处 在 场景 不 同 区 域 的 物体 被 存储 在 不 同 的 分 支 上 。 因 此 ， 仅 需 忽略 树 中 的 整个 分 支 ， 就 可 以 去 
除 大 部 分 的 场景 图 。 





走 … :可 人 
你 喜 否 注意 到 有 斑纹 的 衬 表 和 领带 在 电视 屏幕 上 会 出 现 琳 怪 的 “闪光 ”9? 这 是 二 个 称 为 
走样 (aliasing ) 的 现象 产生 的 结果 ， 当 所 期 望 的 图 像 网 格 中 的 模式 与 组 成 图 像 的 像素 密度 不 
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匹配 时 ， 就 会 产生 走样 现象 ， 例 如 ， 假 设 图 像 的 一 部 分 由 黑白 相间 的 条 纹 构成 ， 但 是 所 有 像 
素 的 中 心 碰巧 落 在 黑色 条 纹 上 ， 那 么 物体 将 被 当 作 全 黑色 的 来 浑 染 。 但是， 如 果 物 体 稍 微 移 
动 一 下 ， 所 有 像素 的 中 心 可 能 都 落 在 白色 条 纹 上 ， 这 样 物 体 将 会 突然 变 成 白色 的 。 有 多 种 方 
法 可 以 改善 这 种 令 人 心烦 的 效果 。 其中 一 种 就 是 使 用 图 像 小 区 城 的 均值 而 不 是 精确 的 单个 上 
来 浑 染 每 一 个 像素 . 


确定 和 去 除 那 些 与 视 体 不 相交 的 物体 后 ， 剩 余 的 物体 通过 称 为 裁剪 〈clipping) 的 操作 加 以 
整理 ， 它 实际 上 就 是 去 掉 每 个 物体 处 在 视 体 外 面 的 部 分 。 更 准确 点 ， 裁 前 操作 首先 把 每 个 平面 
片 与 视 体 边界 进行 比较 ， 然后 去 除 平面 记 落 在 外 面 的 部 分 。 最 终 得 到 完全 都 处 在 视 体 里 面 的 多 
边 形 网 格 〈 可 能 是 被 裁剪 的 平面 片 )。 

演 染 流水 线 的 下 一 步 是 确定 剩余 平面 片上 的 点 ， 这 些 点 与 最 终 图 像 中 的 像素 位 置 相对 应 。 
只 有 这 些 点 将 会 对 最 终 图 像 产 生 影 响 ， 认 识 到 这 一 点 是 很 重要 的 。 如 果 物 体 上 的 细节 落 在 像素 
位 置 的 中 间 ,， 那 它 将 不 会 显示 在 最 终 图 像 中 。 这 就 是 像素 数 在 数码 相机 市 场 被 着重 宣 传 的 原因 。 
像素 点 数 越 高 ， 小 的 细节 就 越 容易 被 拍摄 在 照片 中 。 

把 像素 位 置 与 场景 中 的 点 相关 联 的 过 程 称 为 扫描 转换 〈scan conyversion)《〈 因 为 它 义 及 把 面 
片 转化 为 水 平 的 一 行 像素 点 , 这 称 为 扫描 线 ) 或 光 顶 化 (rasterization)( 因 为 一 组 像 妹 称 为 沧 顶 )。 
扫描 转换 是 由 从 投影 中 心 出 发 穿 过 图 像 窗 口中 的 每 个 像素 的 射线 〈 放 映 机 ) 来 完成 的 ， 然 后 找 
到 这 些 投影 线 与 平面 片 的 交点 ， 最 后 ， 根 据 这些 交 点 我 们 得 到 物体 在 图 像 上 的 显示 。 和 实际 上 ， 
这 些 点 在 最 终 图 像 中 是 基于 像素 显示 的 。 

图 10-11 描 述 了 单个 三 角形 面 的 扫描 转换 。 这 幅 图 的 a 部 分 显示 了 如 何 通过 投影 线 实 现 像素 
位 置 与 面 片上 点 的 关联 ,b 部 分 显示 了 通过 扫描 转换 得 到 的 面 片 的 像素 图 像 。 像 素 的 整个 数组 ( 光 
栅 ) 由 网 格 来 表示 ， 关 联 三 角形 的 像素 已 经 被 着 色 。 注 意 ， 这 个 图 还 显示 了 ， 当 扫描 转换 特征 
点 相对 小 于 像素 尺寸 时 ， 会 产生 变形 。 大 多 数 拥有 个 人 计算 机 的 用 户 会 经 党 在 显示 屏 上 看 到 这 
种 锅 齿 状 的 边缘 。 

遗憾 的 是 ， 整 个 场景 《即使 是 单个 物体 ) 的 扫描 转换 不 像 扫 摘 转 换 单 个 面 睫 那样 直观 明了 。 
这 是 因为 ， 当 涉及 多 个 面 片 时 ， 一 个 面 片 可 能 会 逛 盖 住 另 一 个 面 片 。 这 样 ， 即 使 投影 线 与 平面 
片 相 交 ， 面 片上 的 这 个 点 在 最 终 图 像 上 也 不 一 定 可 见 。 识 别 和 去 除 场景 中 被 遗 挡 的 点 的 处 理 称 
为 隐藏 面 消 除 (hidden-surface removal )。 

隐藏 面 消除 的 一 个 具体 方法 是 使 用 后 面 消除 法 (back face elimination)， 也 就 是 不 考虑 那些 
在 和 多边形 网 格 中 表示 物体 “后 面 ” 的 面 片 。 注 意 后 面 消除 是 相对 直观 的 ， 可 以 认为 那些 瑚 同 是 
背 着 相机 的 面 片 是 处 在 物体 后 面 的 。 

但 是 ， 后 面 消除 法 不 能 完全 解决 隐藏 面 消除 问 题 。 例 如 ， 想 铺 一 辆 汽车 在 大 楼 前 的 场景 ， 
来 自 汽车 和 大 楼 的 平面 片 将 会 投影 到 图 像 裤 口 的 相同 区 域 。 在 重 和 天 发 生 的 地 方 ， 最 终 存 储 在 帆 
缓冲 区 中 的 像素 数据 对 应 前 景物 体 〈 汽 车 ) 的 显示 ， 而 不 是 背景 物体 【大 楼 )。 总 之 ， 如 果 投 影 
线 与 多 于 一 个 平面 片 相 交 ， 那 么 最 靠近 图 像 窗 口 的 面 片 上 的 点 应 该 第 演 认 。 

解决 “前 景 /背景 ”问题 的 一 个 简单 方法 〈 从 所 周知 的 画家 算法 (painter's algorithm)) 就 
是 根据 相机 到 物体 的 距离 ， 在 场景 中 依次 放置 物体 ， 然 后 先 扫 描 转 换 最 远 的 物体 ， 人 允许 较 近 物 
体 的 扫描 转换 结果 覆盖 先前 的 任何 结果 。 遗 民 的 是 ， 男 家 算法 不 能 处 理 对 象 纠缠 在 一 起 的 情况 。 
比如 ， 树 的 一 部 分 可 能 在 一 个 物体 的 后 面 ， 而 树 的 另 一 部 分 可 能 在 这 个 物体 的 前 面 。 

对 于 “前 景 /此 景 ”问题 的 更 彻底 的 解决 方案 是 集中 考虑 单个 像素 ， 而 不 是 整个 场景 。 一 种 
常用 的 技术 就 是 使 用 一 个 称 为 z 归 冲 区 (〈z-buffer) 的 额外 的 存储 区 域 〈 也 是 深度 缓冲 区 )， 它 包 
含 了 图 像 中 每 个 像素 的 通道 〈 也 可 以 说 是 帧 缓冲 区 中 的 像素 通道 )。z 组 冲 区 中 的 每 个 位 置 被 用 
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来 存储 沿 着 相应 的 投影 线 从 相机 到 物体 间 的 距离 , 而 这 些 物体 用 帧 缓冲 区 中 相应 的 通道 来 表示 。 
只 有 当 像 素数 据 还 没有 放 在 帧 缓冲 区 内 ， 或 者 当前 所 观察 物体 的 点 比 先前 浑 染 的 物体 的 点 更 近 
时 《这 是 由 帧 缓冲 区 中 所 记录 的 距离 信息 决定 的 )， 借 助 于 z 缓 冲 区， 并 通过 计算 和 存储 像素 的 
显示 , “前景 /背景 ”问题 才 得 以 解决 。 


人 分解 成 像 隶 位 直 
的 图 像 窗口 






像素 位 首 






投影 线 


让 和 





图 2 HH 
投影 中 已 (a) 扫描 转换 过 程 


生硬 男 各 画 商 天 一 灿 攻 而 用 本 曾 局 古 
三 角形 面 月 [| LI 
相关 联 的 像素 “TEA 名 辆 
-十 直上- 


了 | 寺 才 二 上 十 :| 

| | LI LILLLUIL LI LO 
tb) 显示 三 月 形 面 片 的 “投影 形状 ”的 光栅 
图 10-11 前 形 面 片 的 扫 摘 转换 


更 准确 地 说 ， 当 使 用 z 缓 冲 区 时 ， 演 染 过 程 可 以 按照 如 下 步骤 进行 : 为 z 组 剖 区 的 所 有 通道 
设 定 一 个 值 ， 表 示 从 相机 到 要 演 染 物体 间 的 最 大 距离 ， 每 当 考虑 演 染 平面 片上 的 任何 一 个 新 点 
时 ， 首 先 将 其 与 相机 间 的 距离 和 z 绥 冲 区 中 关联 当前 像素 位 置 的 值 进行 比较 ， 如 果 距 离 小 于 z 组 
冲 区 中 的 值 ， 则 计算 点 的 显示 ， 在 帧 缓冲 区 中 记录 结果 ， 用 刚 泻 染 点 的 距离 奉 换 z 绷 剖 区 中 的 相 
应 通道 。( 注 意 ， 如 果 此 点 的 距离 大 于 z 缓 冲 区 中 相应 的 值 ， 则 不 用 作 任 何 考虑 ， 这 也 许 是 由 于 
平面 上 的 点 太 远 了 ， 或 者 它 被 已 经 痊 当 的 更 近 的 氮 逛 住 了 。) 


10.4.3 着 色 


一 旦 扫描 转换 已 经 确定 了 要 显示 在 最 终 图 像 中 的 平面 片上 的 点 之 后 ， 演 染 任务 就 变 成 了 决 
定 这 些 点 的 显示 方式 的 处 理 。 这 个 过 程 称 为 着 色 〈shading)。 注 征 ， 着 色 涉 及 计算 从 点 投影 到 
相机 的 光 的 特征 ， 它 取决 于 此 点 表面 的 朝 癌 。 人 毕竟， 点 表面 的 朝 辣 决定 了 镜面 反射 光 、 散 射 光 
和 环境 光 被 相机 担 摄 的 效果 。 

平面 着 色 (flat shading) 是 着 色 问 题 的 一 个 直接 解决 方法 ， 它 是 把 平面 片 的 方向 作为 其 上 
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每 个 点 的 方向 ， 也 就 是 说 ， 假 设 每 个 面 片上 的 表面 都 是 平坦 的 。 但 是 ， 最 终 图 像 将 显示 为 有 校 
角 的 〈 如 图 10-12 所 示 )， 而 不 像 图 10-8 中 显示 得 那样 圆 。 从 某 种 意义 讲 ， 平 面 着 色 生 成 的 是 多 
边 形 网 格 的 图 像 ， 而 不 是 用 网 格 建 模 的 物 体 图 像 。 





图 10-12 ” 当 用 平面 着 色 演 染 时 ， 球 的 可 能 显示 


为 了 生成 更 加 通 真 的 图 像 , 泻 染 过 程 必须 将 每 个 平面 片 的 显示 融合 成 平滑 曲面 显示 的 表面 。 
这 是 通过 佑 算 每 个 演 染 点 最 初 表面 的 真实 方向 来 完成 的 。 

这 个 估计 模式 通常 始 于 指示 多 边 形 网 格 顶点 处 表面 朝向 的 数据 。 获 得 此 数据 有 多 种 方法 。 
一 种 方法 殉 是 在 每 个 项 扣 处 记录 诛 始 表 面 的 方向 ， 并 把 这 个 数据 附 大 在 多 边 形 网 格 上 ， 作 为 建 
模 过 程 的 一 部 分 。 这 生成 了 一 个 带 萌 头 的 多 边 形 网 格 〈 称 为 法 问 量 (normal vector))， 这 些 箭头 
附 看 在 每 个 项 后 上。 每 个 法 同 量 沿 垂直 于 诛 始 表面 的 方 同 指向 外 部 。 这 样 的 多 边 形 网 格 可 以 想 
象 成 如 图 10-13 所 示 的 梓 子 。( 态 一 种 方法 是 计算 与 顶 点 相 邻 的 每 个 面 片 的 划 问 ， 然 后 使 用 这 些 
绷 门 的 “平均 值 ” 来 估计 顶 点 表面 的 朝 网 。) 


问 量 指示 原始 本 全 
表面 的 参加 ss 一 < 一 Te ss 
二 AD 一 一 有 
2 一 人 Ar = 2 了 


图 10-13 在 其 项 氮 处 市 有 旋回 量 的 多 这 形 网 格 的 概念 视图 


不 管 多 边 形 网 格 顶点 的 原始 表面 朝 回 是 如 何 获得 的 ， 这 里 有 几 种 策略 可 以 用 来 对 基于 这 些 
数据 的 平面 片 进行 着 色 ， 包 括 Gouraud 着 色 和 Phong 着 色 ， 它 们 之 间 的 区 别 是 微妙 的 。 二 者 首 
先 都 使 用 面 片 顶点 处 的 表面 朝向 信息 作为 沿 着 面 片 边界 的 表面 朝向 的 近似 。 然 后 Gouraud 着 色 使 
用 这 些 信息 决定 沿 着 面 片 边 界 的 表面 显示 ， 最 后 ， 根 据 这 个 边界 显示 ， 插 值 估 算出 面 片 内 部 点 
处 的 表面 的 显示 。 相 反 ，Phong 痢 色 则 是 根据 沿 着 面 片 边界 的 表面 朝向 ， 播 值 估算 出 面 片 内 部 点 
处 的 表面 朝向 ， 然 后 只 考虑 显示 问题 。( 总 之 ，Gouraud 着 色 将 朝向 信息 转化 为 颜色 信息 ， 然 后 
插值 处 理 颜色 信息 ; 而 Phong 着 色 持 值 处 理 朝向 信息 ， 直 至 估计 出 点 的 朝 癌 ， 然 后 将 朝向 信息 转 
化 为 颜色 信息 。) 结果 是 Phong 着 色 更 容易 检测 到 面 片 内 部 的 镜面 反射 光 ， 因 为 它 更 易 随 表面 朝 
向 的 变化 而 改变 〈 参 见 10.4 节 结尾 处 的 问题 与 练习 3)。 

最 后 ， 应 该 注意 到 可 以 扩充 基础 的 着 色 技 术 , 为 表面 语 加 纹理 显示 。 例 如 ,凹凸 聘 射 (bump 
mapping) 的 方法 ， 实 际 上 就 是 把 生成 的 表面 外 观 朝向 加 上 土 一 个 小 的 变量 ， 这 样 表面 看 起 来 就 是 
粗 炸 的 。 更 准确 地 说 ， 四 四 映射 在 传统 着 色 算 法 所 使 用 的 插值 算法 中 加 了 一 个 自由 庆 ， 这 样 整 
个 表面 看 起 来 就 是 有 纹理 的 ， 如 图 10-14 所 示 。 
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图 10-14 使 用 四 凸 映 射 演 染 时 ， 球 的 可 能 显示 
10.4.4 泻 染 一 流水 线 硬件 


正如 我 们 已 经 说 过 ， 光 内 流 水 线束 是 依次 执行 裁 前 、 扫 描 转 换 、 隐 藏 面 的 消除 和 着 色 处 理 
这 些 操作 。 热 行 这 些 任 务 的 高 效 算 法 是 众所周知 的 ， 它 们 已 经 直接 实施 于 电子 电路 中 ， 通 过 超 
大 规模 集成 电路 〈《VLSI) 芯片 技术 已 经 被 微缩 成 芯片 ， 自 动 完 成 整个 益 染 流水 线 。 如 今 ， 即 使 
是 低廉 的 产品 也 具有 每 秒 泻 染 几 百 万 个 平面 片 的 能 力 。 

大 多 数 专 门 进行 图 形 处 理 的 计算 机 系统 (包括 视频 游戏 机 ) 在 它们 的 设计 中 加 入 这 些 设 备 。 
在 更 通用 的 计算 机 系统 中 ， 可 以 以 图 形 卡 〈graphics card) 或 图 形 适 配器 〈graphics adapter) 的 
形式 加 入 这 种 技术 ， 它 作为 一 个 专门 的 控制 器 与 计算 机 的 总 线 连接 〈 参 见 第 2 章 )。 这 样 的 硬件 
大 大 减少 了 执行 演 染 处 理 所 需 的 时 间 。 

泻 染 一 流水 线 便 件 同 样 降 低 了 图 形 应 用 软件 的 复杂 度 。 本 质 上 讲 ， 所 有 软件 需要 去 做 的 是 
器 图 形 硬件 提供 场景 图 ， 然 后 硬件 执行 流水 线 步 骤 ， 把 结果 放置 在 帧 缓冲 区 中 。 这 样 ， 从 软件 
的 角度 来 看 ， 整 个 演 染 流水 线 被 缩减 为 作为 抽 银 工具 来 使 用 硬件 这 一 步骤 。 

作为 一 个 例子 ， 再 次 考虑 交互 式 视 频 游 戏 。 为 了 初始 化 游戏 ， 游 戏 软件 把 场景 图 传送 给 图 
形 硬 件 ， 然 后 硬件 演 染 场景 ， 把 图 像 放 置 在 帧 缓冲 区 中 ， 从 这 里 图 像 就 可 以 自动 地 显示 在 监视 
屏 上 。 当 进行 游戏 时 ， 游 戏 软件 只 需要 更 新 图 形 硬件 中 的 场景 图 ， 以 反映 出 游 戏 场景 的 改变 ， 
”而 硬件 则 不 断 地 泻 染 场景 ， 每 一 次 都 把 更 新 的 图 像 放 置 在 帧 缓冲 区 中 。 

但 是 应 该 注意 到 ,不 同 图 形 硬 件 的 处 理 能 力 和 通信 特性 是 完全 不 同 的 。 这 就 导致 ， 如 果 
像 视频 游戏 这 样 的 应 用 是 在 特定 的 图 形 平台 上 开发 的 , 当 移 植 到 另 一 个 环境 中 时 , 它 就 不 得 
不 进行 修改 。 为 了 减少 对 特定 图 形 系 统 的 依赖 ， 标 准 的 软件 接口 已 经 开发 出 来 ， 它 在 图 形 硬件 
与 应 用 软件 之 间 起 着 重要 的 调节 作用 。 这 些 接口 包括 把 标准 化 命令 转化 为 特殊 图 形 硬 件 系统 所 
需 具 体 指令 的 软件 例 程 。 这 些 例 子 包 售 DpenGL (Open Graphics Library )， 它 是 由 Silicon Graphics 
开发 的 非 专 有 系统 ， 广 泛 地 用 在 视频 游戏 行业 ，Direct3D 是 微软 为 windows 环 境 开 发 的 。 

最 后 应 该 注意 到 ， 演 染 流水 线 具 有 很 多 优点 ， 但 它 也 是 有 缺点 的 ， 其 中 最 显著 的 就 是 流水 
线 只 实现 了 局 部 照明 模式 〈local lighting model), 这 意味 着 流水 线 泻 染 的 每 个 物体 是 独立 于 另 一 
个 物体 的 。 也 就 是 说 ， 在 局 部 照明 模式 下 ， 每 个 物体 是 相对 于 光源 被 演 当 的， 仿佛 它 是 场景 中 
的 唯一 物体 。 结 果 是 没有 捕获 到 物体 间 的 光 交 互 〈 如 阴影 和 反射 )。 与 之 相对 ， 全 局 照明 模式 
(global lighting model) 就 考虑 了 物体 间 的 交互 。 在 10.5$ 节 中 我 们 将 讨论 两 种 实现 全 局 照明 模式 
的 技术 。 现 在 我 们 仅 需 注意 到 ， 这 些 技术 超出 了 当前 技术 的 实时 能 力 。 

但 是 ,这 并 不 音 味 着 使 用 演 染 流水 线 硬 件 的 系统 不 能 够 产生 一 些 全 局 照明 的 效果 。 裤 际 上 ， 
马 妙 的 技术 已 经 被 开发 出 来 ， 以 克服 局 部 照明 模式 所 强加 的 一 些 限 制 。 特 别 是 可 以 在 局 部 照明 
模式 的 环境 里 模拟 阴影 (drop shadow) 的 显示 《〈 投 在 地 上 的 影子 )， 通 过 建立 投影 物体 的 和 多边 
形 网 符 的 副本 ， 把 网 格 副本 变 成 平坦 的 ， 然 后 放 在 地 面 上 ， 涂 以 黑色 。 换 言 之 ， 建 模 阴 影 ， 就 
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好 像 它 是 另 一 个 物体 ， 可 以 用 传统 的 泻 染 流水 线 硬件 来 泻 染 ， 生 成 阴影 的 幻觉 。 这 种 技术 既 在 
“大 你 水 平 ” 应 用 《如 交互 式 视频 游戏 )， 也 在 “专业 水 平 ” 应 用 《如 飞行 模拟 )。 


问题 与 练习 

.总结 针 面 反射 光 、 和 散射 光 和 环境 光 之 间 的 区 别 。 

. 定义 术语 裁 台 和 扫描 转换 。 

， Gouraud 者 色 和 Phong 着 色 可 以 被 总 结 为 ; 
Gouraud 腹 包 使 用 沿 郑 面 片 的 边界 的 物体 表面 的 朝向 决定 沿 着 边界 的 表面 的 显示 ， 然 后 把 这 些 显 示 揪 
仁 到 面 片 的 内 部 ， 生 成 特定 点 的 显示 ;Phong 着 色 通 过 对 边界 朝向 的 插值 ， 计 算 面 片 内 部 点 的 朝向 ， 
失 后 慰 用 这 些 蝴 向 生成 特定 点 的 显示 。 物 体 的 显示 有 何不 同 ? 


让 


4. 罗 梨 永 线 的 意义 是 什么 ? 
5. 描述 使 用 局 部 照明 模式 ， 镜 子 中 的 反射 如 何 模拟 。 


10.5 ”处 理 全 局 照明 
研究 者 当前 正在 研究 两 种 可 以 替代 泻 染 流水 线 的 方法 ， 这 两 种 方法 都 实现 了 全 局 照明 模式 ， 


- 克 服 了 传统 流水 线 中 局 部 照明 模式 的 固有 局 限 。 其 中 一 种 方法 是 光线 跟踪 ， 另 一 种 是 辐射 度 。 


两 种 方法 在 处 理 时 都 极为 精确 但 也 很 费时 ， 在 下 文 马上 就 可 以 看 到 。 
10.5.1 ”光线 跟 踪 


光线 跟踪 (ray tracing ) 本 质 上 是 沿 着 到 达 视 点 的 光线 的 反方 向 跟踪 , 找到 它 的 光源 的 过 程 。 
这 个 过 程 首先 选择 要 泻 染 的 像素 ， 确 定 经 过 这 个 像素 和 投影 中 心 的 直线 ， 然 后 跟踪 沿 着 这 条 让 
线 射 入 图 像 窗 口 的 光线 。 这 个 跟踪 过 程 沿 着 此 直线 进入 场景 ， 直 至 与 物体 相交 。 如 果 这 个 物体 
征 光 源 ， 则 终止 光线 跟踪 过 程 ， 将 像素 泻 染 为 光源 上 的 一 个 点 ; 否则 ， 将 计算 物体 表面 的 特性 ， 
以 此 得 到 入 射 光 的 方向 ， 当 前 跟踪 的 光线 是 入 射 光 被 反射 后 产生 的 反射 光线 。 然 后 继续 跟踪 入 
射 光 线 疝 后 找到 此 光源 的 来 源 之 处 ， 在 这 点 上 可 能 还 会 有 另 一 条 光线 需要 识别 和 跟踪 。 

图 10-15 给 出 了 一 个 光线 跟踪 的 例子 ， 在 图 中 可 以 看 到 被 跟踪 的 光线 向 后 穿 过 图 像 窗 口 ， 到 
达 镜 子 的 表面 ， 从 这 里 跟踪 光线 至 一 个 有 光泽 的 球 ， 再 向 后 到 镜子 ， 然 后 从 镜子 到 光源 。 基 于 
从 这 个 跟踪 过 程 中 获得 的 信息 ， 图 像 中 的 像素 应 该 显示 为 球 上 的 一 点 ， 而 这 个 球 是 被 反射 在 镜 
子 中 的 光源 照 亮 的 。 

光线 跟踪 的 一 个 缺点 在 于 它 仅 跟踪 镜面 反射 光 。 因 此 ， 通 过 这 种 方法 泻 染 的 所 有 物体 往往 
者 显示 为 有 光泽 的 。 可 以 使 用 分 布 式 光 线 跟 踪 〈distributed ray tracing) 来 去 除 这 种 效果 。 分 布 
式 光 线 跟 踪 与 光线 跟踪 的 区 别 在 于 ， 它 并 不 仅仅 跟踪 从 反射 点 向 后 的 单条 光线 ， 而 是 同时 跟踪 
从 这 所 出 发 的 多 条 光线 ， 每 条 光线 的 延伸 方向 略 有 不 同 。 

当 透 明 的 目标 被 涉及 时 ， 另 一 个 基本 光线 跟踪 的 变异 是 可 以 应 用 的 。 在 这 种 情况 下 ， 每 当 
千 后 跟踪 光线 至 表面 时 ， 必 须 考虑 两 种 效果 ， 一 种 是 反射 ， 另 一 种 是 折射 。 例 如 ， 注 意图 10-1 
中 巴 斯 光 年 《太空 突击 队员 ) 头 田 的 透明 显示 ， 以 及 靠近 头 大 上 表面 的 反射 高 光 。 在 这 种 情况 
下 ， 跟 踩 筷 始 光 的 任务 分 成 了 两 个 : 回 湖 反 射 光 和 回 渊 折射 光 。 

光线 跟踪 通常 是 递归 实现 的 ， 每 次 递归 都 跟踪 光线 到 它 的 源头 。 第 一 次 递归 可 能 跟踪 它 的 
光线 到 一 个 有 光泽 的 不 透明 的 表面 。 在 这 点 上 此 光线 可 能 被 确认 为 一 条 入 射 光 线 的 反射 光 ， 计 
算 这 个 入 射 光 的 方向 ， 调 用 下 一 次 递归 去 跟踪 这 个 入 射 光 线 。 第 二 次 递归 将 执行 类 似 的 任务 ， 
去 查找 它 的 光线 的 源头 。( 这 个 过 程 可 能 还 会 递归 调用 。) 
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镜子 中 的 这 一 点 应 该 党 名 
为 被 反射 在 镜子 中 的 光源 
照 亮 的 球 的 背面 





像素 位 置 


鲁 像 窗口 


图 10-15 ”光线 跟踪 


终止 递归 的 光线 跟踪 有 多 种 判断 条 件 : 被 跟踪 的 光线 与 光源 相交 ， 被 跟踪 的 光线 射出 画面 
不 再 与 场景 中 的 景物 相交 ， 或 者 是 跟踪 层 数 达 到 了 预定 的 限制 。 还 有 另 一 种 终止 条 件 是 以 表面 
的 芭 收 特性 为 根据 ， 如 果 表 面 是 高 吸收 性 的 《如 灰 瞳 不 光滑 的 表面 )， 那 么 任何 入 射 光 线 几 乎 都 
不 会 对 表面 的 显示 产生 影响 ， 光 线 跟 踪 停止 ， 累 积 的 吸收 会 产生 相似 的 效果 。 也 就 是 说 ， 访 问 
多 个 适度 可 吸收 性 的 表面 后 ， 光 线 跟 踪 可 以 终止。 

正 征 莽 于 全 局 照明 模式 ， 光 线 跟 踪 才 能 避免 传统 泻 染 流水 线 中 许多 固有 的 局 限 。 例 如 ， 隐 
闫 面 的 消除 和 阴影 检测 通常 可 以 用 光线 跟踪 过 程 解决 。 遗 憾 的 是 ,光线 跟踪 有 一 个 很 大 的 缺点 ， 
那 克 古 费时 。 当 跟踪 每 条 反射 光线 至 其 源 点 时 ， 需 要 的 计算 量 迅 速 增 大 ,，( 当 涉及 折射 或 者 应 用 
分 布 式 光线 跟踪 时 ， 这 个 问题 是 混合 的 .) 因此 ， 光 线 跟 踪 没 有 在 “大 众 水 平 ” 的 实时 系统 中 实 
现 〈 如 交互 式 视频 游戏 )， 相 反 可 以 在 “专业 水 平 ”的 应 用 中 找到 ， 这 些 应 用 对 实时 性 要 求 不 高 
《如 电影 工作 室 中 使 用 的 图 像 软 件 )。 


10.5.2 ”辐射 度 


习 一 种 可 以 取代 传统 滨 染 流水 线 的 方法 就 是 辐射 度 (radiosity )。 光 线 跟 踪 通 过 跟踪 单条 光线 ， 
采用 点 到 点 的 方法 ; 而 辐射 度 通过 考虑 平面 片 对 之 间 辐 射 光 能 的 总 和 , 采取 了 更 加 区 域 化 的 方法 。 
这 个 辐射 的 光 能 本 质 上 就 是 散射 光 。 从 一 个 物体 辐射 的 光 能 或 者 是 物体 产生 的 【如 光源 这 种 情 
况 )， 或 者 是 物体 反射 的 。 然 后 通过 考虑 从 其 他 物体 接收 的 光 能 ， 来 决定 每 个 物体 的 显示 。 

从 一 个 物体 辐射 的 光 对 另 一 个 物体 显示 的 影响 程度 是 由 称 为 形状 因子 《form factor) 的 参数 
来 衡量 的 。 在 场景 中 要 泻 染 的 每 个 面 片 都 关联 唯一 的 形状 因子 。 这 些 形状 因子 考虑 了 面 片 间 的 
儿 何 天 系 ， 比 如 分 开 的 距离 和 相对 的 朝向 等 因素 。 为 了 显示 场景 中 的 一 个 面 片 ， 需 要 计算 此 面 
片 历 接收 的 来 目 场景 中 其 他 面 片 的 光 能 总 量 ， 每 次 计算 都 要 使 用 一 个 合适 的 形状 因子 ， 将 结果 
结合 ， 产 生 每 个 面 片 的 单个 颜色 和 强度 。 然 后 使 用 类 似 于 Gouraud 着 色 的 技术 ， 将 这 些 值 插值 到 
相 邻 的 面 片 中 间 ， 获 得 光滑 没有 棱角 的 表面 。 

内 为 要 考虑 许多 面 片 ， 所 以 辐射 度 的 计算 量 是 很 大 的 。 因 此 ， 与 光线 跟踪 一 样 ， 辐 射 度 的 
应 用 无 法 满足 当前 消费 市 场 上 图 形 系统 的 实时 要 求 。 辐 射 度 的 另外 一 个 问题 在 于 ， 由 于 它 处 理 
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的 单元 包含 整个 面 片 ， 而 不 是 单个 的 点 ， 所 以 它 捕 获 不 到 镜面 反射 光 ， 这 就 导致 用 辐射 度 泻 染 
的 所 有 表面 的 显示 往往 是 灰暗 的 。 

但 征 ， 辐 射 度 的 确 有 它 的 优点 。 首 先 ， 使 用 辐射 度 决定 物体 的 显示 是 不 受 相 机 影响 的 。 这 
任 ， 一 旦 计算 了 一 个 场景 的 辐射 度 ， 那 么 当 相机 位 置 改变 时 ， 场 景 的 泻 染 将 会 快速 完成 . 其 次 ， 
福 射 度 捕 获 了 光 的 许多 细微 特征 ， 如 滩 色 (color bleeding )， 印 一 个 物体 的 颜色 影响 周围 其 他 物 
体 的 色调 。 因 此 ， 辐 射 度 有 它 的 特定 应 用 。 一 个 就 是 用 在 建筑 设计 的 图 形 软件 中 。 实际 上 ， 建 
筑 内 的 光 主 要 是 由 散射 光 和 环境 光 组 成 ， 镜 面 反 射 光 的 影响 不 大 ， 通过 快速 切换 相机 的 位 置 ， 
建筑 师 能 很 快 从 不 同 的 视角 看 到 不 同 的 房间 。 


问题 与 练习 

1. 为 什么 光线 跟踪 是 沿 着 光线 向 后 〔 从 图 像 窗 口 到 光源 ) ， 而 不 是 向 前 《从 光源 到 图 像 窗口 ) ? 
2. 直接 的 光线 跟踪 和 分 布 式 光线 跟踪 间 的 区 别 是 什么 ? 

3. 辐射 度 的 两 个 缺点 是 什么 ? 

4. 光线 跟踪 和 辐射 度 在 哪些 方式 上 是 相似 的 ? 在 哪些 方式 上 是 不 同 的 ? 
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106 动画 本 
我 们 现在 转向 计算 机 动画 这 个 课题 ， 它 是 使 用 计算 机 技术 来 生成 和 显示 呈现 运动 的 图 像 。 


10.6.1 动画 基础 


我 们 先 介绍 一 些 基 本 的 动画 概念 。 

1. 由 

动画 是 通过 快速 连续 地 显示 图 像 序列 〈 称 为 帧 (frame)) 获得 的 。 这 些 帧 捕获 了 相同 时 间 
辐 了 出 内 变化 场景 的 显示 。 这 样 ， 它 们 的 顺序 展示 就 产生 了 -直观 看 连续 场景 的 错觉 。 在 制 片 厂 
旺 丰 的 标准 速率 是 每 秒 24 帧 ， 广 播 视频 的 标准 是 每 秒 60 帧 〈 由 于 每 隔 -- 帧 的 视频 帧 被 用 来 与 前 
一 和 帧 混合 ， 以 产生 完整 细节 的 图 像 ， 所 以 视频 也 可 以 被 归 类 为 每 秒 30 帧 的 系统 )。 

怖 可 以 由 传统 的 照片 生成 ， 也 可 以 应 用 计算 机 图 形 学 生成 。 而 且 ， 这 两 种 技术 还 可 以 相 结 
全 应 用 。 例 如，2D 图 形 软件 经 常 被 用 来 修改 通过 照片 获得 的 图 像 ， 消 去 支撑 金属 丝 、 添 加 图 像 、 
和 创建 融合 (morphing) 效应 〈 这 是 一 个 物体 看 起 来 要 转化 成 另 一 个 物体 的 处 理 )， 

让 我 们 一 起 来 深入 研究 融合 ， 它 使 动画 变 得 更 有 趣 。 构 建 融合 效应 首先 要 确定 把 融合 序列 括 
在 起 的 一 对 关键 帧 。 一 个 是 融合 处 理 之 前 的 最 后 一 帧 的 图 像 ， 另 一 个 融合 处 理 之 后 的 第 -- 帧 图 
像 。( 在 传统 的 电影 制作 中 ， 这 需要 “拍摄 ”两 个 动作 序列 ， 一 个 是 在 融合 之 前 发 生 ， 另 -个 在 
融合 后 进行 。) 把 融合 前 与 融合 后 帧 中 的 相似 特征 相关 联 的 点 称 为 控制 点 (control point)。 融 合 处 
注定 指 通 过 应 用 数学 技术 ， 以 控制 点 作为 基准 ， 逐 渐 把 一 幅 图 像 转变 为 另 一 幅 图 像 的 处 理 过 程 。 
通过 记录 融合 过 程 中 所 产生 的 图 像 ， 得 到 了 一 个 简短 的 人 工 合成 的 图 像 序列 ， 把 它 填充 到 当初 定 
义 的 那 时 关键 帧 之 间 ， 就 创建 了 融合 效应 。 


Kineographs- 
长 ineographs 是 以 书页 作为 帧 的 动画 , 它 通过 书页 快速 翻动 来 模拟 帧 的 播放 通过 这 本 书 ， 
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你 能 制作 你 自己 的 色 ineographs (假定 你 还 没有 在 书 的 空白 处 填 满 涂 鸡 )。 在 第 一 页 的 空白 处 
放置 一 修 圆 点， 然后 在 第 三 页 放置 只 一 个 圆 点 ， 位 置 与 第 一 页 的 稍 有 不 同 。 在 每 个 连续 的 坷 
数 页 上 重复 这 个 过 程 ， 直 到 你 到 达 了 书 的 末尾 处 。 现在， 快速 翻动 书页 ， 观 察 点 的 跳动 情况 ， 
一 转眼 ， 你 已 经 制作 了 自己 的 儿 ineographs， 也 许 这 是 你 还 向 动画 事业 的 第 一 步 。 作 为 运动 学 
的 一 个 实验 ,你 可 以 试 着 画 棒 形 人 物 替代 简单 的 圆 点 ， 使 得 棒 形 人 物 看 起 来 像 在 走路 , 现在， 
动力 等 实 验 是 通过 产生 水 滴 撞 击 地 面 的 图 像 来 进行 的 。 


2. 故事 板 

一 个 典型 的 动画 项 目 是 以 故事 板 (storyboard) 的 建立 开始 的 , 故事 板 是 一 个 二 维 图 像 序列 ， 
用 关键 点 显示 的 场景 略图 的 形式 讲述 一 个 完整 的 故事 。 故 事 板 的 最 终 角 色 取 决 于 动画 项 目 是 用 
2D 技 术 ， 还 是 用 3D 技 术 实现 的 。 在 使 用 2D 图 形 的 项 目 中 ， 故 事 板 一 般 会 转变 成 帧 中 的 最 终场 
景 ， 避 像 19 世 纪 20 年 代 迪 士 尼 工作 室 所 做 的 一 样 。 在 那个 时 候 ， 艺 术 家 〈 称 动画 大 师 ) 将 把 故 
事 板 细 化 为 详细 的 帧 〈 称 之 为 关键 帧 〈key frame))， 它 决定 了 动画 固定 时 间 间 隔 的 角色 和 场景 
的 显示 。 动 画 助手 将 绘制 出 填充 关键 帧 之 间 间 隔 的 另外 的 帧 ， 以 使 动画 看 起 来 连续 而 平滑 。 这 
个 填充 间隔 的 处 理 称 为 中 间 存 在 〈in-betweening )。 

与 以 前 不 同 的 是 ， 现 在 的 动画 制作 人 员 使 用 图 像 处 理 和 2D 图 形 软 件 绘制 出 关键 帧 ， 大 量 的 
中 间 存 在 的 处 理 是 自动 的 ， 所 以 已 经 不 存在 动画 助手 这 个 角色 。 

3. 3D 动 画 

大 多 数 视频 游戏 动画 和 全 特性 的 动画 产品 现在 是 使 用 3D 图 形 创建 的 。 在 这 些 情况 下 ， 项 目 
仍旧 先 创 建 由 二 维 图 像 组 成 的 故事 板 。 但 是 ， 与 发 展 成 为 2D 图 像 项 目的 最 终 产 品 不 同 ， 故 事 板 
被 用 作 构 建 三 维 虚 拟 世界 的 蓝图 。 当 其 中 的 物体 按照 脚本 移动 或 在 视频 游戏 中 行进 时 ， 这 个 虚 
拟 世 界 将 不 断 地 被 “拍摄 ”。 

也 许 我 们 应 该 停 下 来 型 清楚 物体 在 计算 机 生成 的 场景 内 移动 的 含义 。 记 住 ,“ 物 体 ” 实 际 上 
是 存储 在 场景 图 中 的 数据 集合 。 这 个 集合 中 的 数据 是 一 些 指示 物体 位 置 和 朝向 的 值 。 这 样 , “ 移 
动 ”一 个 物体 仅 需 通过 改变 这 些 值 就 可 以 完成 。 一 有 旦 已 经 作出 这 些 改 变 ， 新 的 值 将 被 用 在 泻 染 
处 理 中 。 从 而 ， 物 体 将 在 最 终 的 二 维 图 像 中 显示 为 已 经 移动 。 


模糊 

在 传统 的 摄影 领域 ， 人 们 作出 了 大 量 的 努力 ， 以 获得 快速 运动 物体 的 清晰 图 像 。 在 动画 
领域 ， 相 反 的 问题 产生 了 。 如 果 描 述 运动 物体 的 序列 帧 中 的 每 一 帧 都 把 物体 泻 当成 清晰 的 图 
像 ， 那 么 运动 可 能 显示 为 急 动 的 。 然 而 ， 清 晰 的 图 像 是 创建 帧 时 的 自然 副产品 ， 国 为 场景 图 
中 的 每 幅 图 像 都 是 静止 的 。 这 样 ， 动 画 制 作 人 员 经 常 需要 手动 地 改变 计算 本 生成 帧 中 的 运动 
物体 的 图 像 。 有 一 种 技术 称 为 超 取样 ( supersampling )， 它 产生 多 幅 图 像 ， 其 中 运动 物体 只 是 
稍微 地 移动 ， 然 后 重 登 这 些 图 像 生 成 单 帧 。 另 一 种 技术 是 改变 运动 物体 的 形状 ， 和 债 它 看 起 来 
像 是 沿 着 运动 方向 延 伸 的 ， 


10.6.2 ”运动 宇和 动力 学 


3D 图 形 场景 中 的 运动 究竟 是 自动 的 ， 还 是 受 动画 制作 者 控制 的 ， 这 个 自动 化 的 程度 随 应 用 
的 不 同 而 变 得 不 尽 相同 。 当 然 ， 目 标 是 整个 过 程 的 自动 化 。 为 了 实现 这 个 目标 ， 许 多 研究 已 经 
直接 朝 着 找寻 能 识别 和 模拟 自然 发 生 现象 的 运动 的 方法 。 机 械 学 中 的 两 个 领域 被 证 明 在 这 一 点 
上 特别 有 用 。 
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一 个 是 动力 学 (dynamics )， 它 通过 应 用 物理 定理 计算 力作 用 于 物体 的 效果 ， 来 描述 物体 的 
运动 。 例如， 除了 位 置 外 ， 场景 中 的 物体 可 能 被 赋予 运动 的 方向 、 速 度 和 质量 ， 然后 使 用 这 些 
数据 来 决定 重力 或 与 其 他 物体 的 碰撞 对 物体 产生 的 影响 ， 为 软件 计算 下 一 帧 中 物体 的 合理 位 置 
提供 依据 。 

考虑 创建 一 个 描述 容器 中 的 水 晃动 的 动画 序列 。 我 们 可 以 使 用 场景 图 中 的 粒子 系统 来 表示 水 ， 
每 个 粒子 表示 一 个 小 单位 的 水 。 《想象 水 由 石 弹子 大 小 的 大 “分 子 ” 构 成 。) 那么 ， 当 容器 从 一 边 摇 
到 另 一 按时， 我 们 可 以 应 用 物理 定理 ， 夺 算 粒子 重力 的 影响 ， 以 及 粒子 问 的 影响 互相 。 这 样 可 以 计 
算出 固定 时间 间隔 内 每 个 粒子 的 位 置 ， 通过 使 用 外 层 粒 子 的 位 置 作为 多 边 形 网 格 的 顶点 ， 我 们 能 够 
获得 描述 水 表面 的 网 格 。 在 模拟 过 程 中 ， 通 过 不 断 地 “拍摄 ” 这些 网 格 ， 就 得 到 了 动画 。 

用 来 模拟 运动 的 另 一 个 机 械 学 分 支 是 运动 学 (kinematics)， 它 根据 物体 各 部 分 间 的 相对 运 
动 方式 ， 来 描述 物体 的 运动 当 模 拟 有 关节 的 角色 时 ， 运动 学 应 用 的 优势 就 特别 显著 ， 因为 这 
青 要 移动 像 手 臂 和 腿 之 类 的 附属 物 。 与 计算 肌肉 和 重力 施加 的 力 的 影响 相 比 ， 模拟 关节 运动 模 
式 更 容易 对 运动 进行 建 模 。 因 此 ， 当 决 定 弹 球 的 路 径 时 ， 动力 学 可 能 是 可 选 的 技术 ， 而 模拟 人 
物 手 臂 的 运动 将 通过 使 用 运动 学 计算 出 合理 的 肩膀 、 抽 、 和 手腕 的 旋转 度 。 因 此 ， 许 多 模拟 生 
物 特性 的 研究 集中 在 下 述 问题 上 一 一 解剖 学 以 及 关节 与 附属 物 的 结构 是 如 何 影响 运动 的 、 

应 用 运动 学 的 一 个 典型 范例 是 ; 首先 用 棒 形 人 物 图 来 表示 人 物 ， 这 个 棒 形 人 物 图 模拟 了 被 
描述 的 人 物 骨 骼 结 梅 ; 然后 用 多 边 形 网 格 覆 盖 人 物 的 每 个 部 分 ， 表示 围绕 这 个 部 分 的 人 物 表 面 ， 
并 且 建 立 相 应 的 规则 ， 诀 定 相 邻 的 网 格 相互 连接 的 方式 。 通过 重新 定位 关节 在 骨骼 结构 中 的 位 
置 ， 人 物 就 能 够 被 操纵 《通过 软件 或 动画 制作 人 )， 厌 像 一 个 人 操纵 线 木 偶 一 样 的 方式 。 “ 线 ” 
连接 到 模型 的 点 称 为 关节 变量 (avars)， 它 是 “articulation variables>” 的 缩写 〈 或 “animation 
variables” 的 缩写 )。 

在 实际 应 用 中 ， 关 节 变 量 不 仅仅 用 来 控制 骨骼 关节 的 位 置 ， 例如 ， 累 y Stom 中 名 为 Woody 
的 牛仔 玩偶 〈 图 10-1) 仅 在 脸 部 就 有 将 近 100 个 关节 变量 ， 动画 制作 者 可 以 通过 改变 相应 变量 的 
值 来 表达 牛仔 玩偶 的 情感 ， 或 根据 所 说 的 话语 变动 口 形 。 

许多 运动 学 应 用 的 研究 已 经 朝 着 开发 算法 的 方向 发 展 ， 以 自动 计算 模拟 自 然 点 生 运动 的 附 
属 物 位 置 的 序列 。 沿 着 这 些 方向 ， 生成 遏 真 的 行走 序列 的 算法 现在 已 经 产生 了 。 

但 是 ， 竺 于 运动 学 的 大 量 动画 还 是 通过 指示 人 物 穿 过 关节 一 附着 物 位 置 的 预 设 序列 而 产生 
的 。 这 些 位 置 可 能 是 由 动画 制作 者 创造 性 地 给 出 ， 或 是 由 运动 捕捉 《motion capture) 而 获得 ， 
当 生 物 模型 执行 相应 的 动作 时 ， 这 个 运动 捕捉 记录 了 模型 的 位 置 。 更 准确 地 说 ， 在 人 身体 上 的 
主要 关节 应 用 反射 带 后 ， 人 投掷 棒球 的 动作 就 可 以 从 多 个 角度 被 拍摄 ， 然后 ， 当 人 进行 投掷 动 
作 时 ， 通 过 观察 各 种 照片 中 反射 带 的 位 置 ， 人 的 手臂 和 腿 的 精确 位 置 就 能 够 被 标识 出 来 。 然后 
将 这 些 位 置 传送 给 动画 中 的 人 物 。 


10.6.3 动画 制作 过 程 


动画 研究 的 最 终 目标 是 自动 化 生成 整个 动画 过 程 。 想 象 一 下 软件 〈 给 出 合理 的 参数 ) 能 自 
动 生成 所 需 的 动画 序列 。 当 今 ， 影 视 公司 通过 单个 虚拟 “机 器 人 ”生成 了 人 群 图 像 、 战 争 场 县 
和 宕 过 的 动物 ， 这 些 “ 机 器 人 ”在 场景 中 自动 移动 ， 每 个 都 执行 它 被 分 配 的 任务 ， 这 充分 印证 
了 人 类 在 动画 制作 领域 中 取得 的 进步 。 ， 

当 拍 摄 《 魔 鬼 约 想 部 队 》 和 《指环 王 三 部 曲 》 中 的 人 类 时 ， 有 趣 的 情况 发 生 了 。 每 一 个 局 
得 上 的 战士 都 被 建 模 成 不 同 的 “智能 ”物体 ， 它 们 具有 自己 的 体型 特征 和 随机 赋予 的 个 性 ， 这 
个 个 性 赋 子 它 一 个 攻击 或 是 迷路 的 倾向 。 在 电影 Helms Desp〈 第 二 部 的 战争 模拟 测试 中 ， 订 
鬼 的 迷 跑 倾向 设置 得 过 高 ， 当 它们 刚 遇 到 人 类 战士 时 ,就 逃跑 了。( 这 也 许 是 虚拟 的 “临时 演员 ， 
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认为 工作 太 和 危险 的 第 一 例 。) 

当然 ， 如 今 许 多 动画 还 是 由 动画 软件 来 制作 的 。 但 是 ， 不 同 于 19 世 纪 20 年 代 的 手工 绘制 二 
维 师 ， 如 今 这 些 动画 制作 使 用 软件 操纵 场景 图 中 的 三 维 虚拟 物体 ， 这 种 方式 让 人 想起 前 面 讨论 
运动 学 时 介绍 的 控制 线 木 偶 。 用 这 种 方式 ， 一 位 动画 制作 者 能 够 创建 一 系列 的 虚拟 场景 ， 这 些 
场景 然后 被 “拍摄 ”成 动画 。 在 某 些 情 况 下 ， 使 用 这 种 技术 来 产生 关键 帧 的 场景 ， 然 后 当 软 件 
应 用 运动 学 和 动力 学 把 场景 图 中 物体 从 一 个 关键 帧 场景 位 置 移 到 下 一 个 关键 帧 场景 位 置 时 ， 再 
使 用 软件 通过 自动 泻 染 场景 来 生产 中 间 存 在 帧 。 

随 独 计算 机 图 形 学 研究 的 进步 以 及 技术 的 持续 发 展 ， 肯 定 会 有 更 多 的 动画 制作 过 程 变 成 自 
动 化 的 。 是 否 有 一 天 动画 制作 者 这 一 角色 将 不 复 存 在 ， 人 类 演员 和 物理 布景 也 将 成 为 过 去 式 ， 
针对 这 一 点 尚 无 定论 ， 但 许多 人 都 认为 这 一 天 不 再 和 远 。 实 际 上 ， 与 把 无 声 电影 转化 为 有 声 电 
影 相 比 ，3D 图 形 学 对 影视 产业 的 影响 更 具 潜力 。 


问题 与 练习 

1. 人 头 看 见 的 图 像 往往 在 人 类 的 感知 上 约 有 200 毫 秒 的 逗留 ， 基 于 这 个 近似 值 ， 每 秒 必须 星 现 多 少 幅 图 
像 ， 才 能 产生 动 丽 ? 这 个 近似 值 是 如 何 对 应 于 电影 中 使 用 的 每 秒 帧 数 的 ? 

2. 什么 是 故事 板 ? 

3. 什么 是 中 间 存 在 ? 

4. 定 久 术语 运动 学 和 动力 学 。 





复习 题 
1. 下 列 哪个 是 2D 图 形 学 的 应 用 ， 哪 个 是 3D 图 形 7. 曾 杰 图 像 窗 口 和 帧 缓冲 区 之 间 的 关系 。 
学 的 应 用 ? 8. 应 用 3D 图 形 学 产生 电影 和 应 用 3D 图 形 学 产生 


交互 式 视频 游 戏 的 动画 , 二 者 之 间 有 什么 明显 
的 不 同 ? 

- 该 出 物体 的 一 些 特 性 ， 这 些 特 性 可 能 出 现在 
3D 图 形 场景 使 用 的 这 个 物体 的 模型 中 ， 说 出 


a、 设 计 杂 志 页 面 的 布局 。 
b. 用 微软 绘图 工具 绘制 图 像 。 
c. 为 视频 游戏 从 虚拟 世界 中 生成 图 像 。 
2. 3D 图 形 学 中 的 哪些 术语 对 应 于 下 列传 统 摄 影 


| 


领域 的 术语 ? 请 阐释 你 的 答案 。 


可 能 不 会 出 现在 模型 中 的 一 些 特 性 。 


a. 胶卷 。 10. 说 出 一 些 未 被 只 含 多 边 形 网 格 模型 捕获 的 物 
b. 取景 器 中 的 矩形 。 体 物理 特性 。 (这样 ， 单 独 的 多 边 形 网 格 没有 
c. 被 拍摄 的 场景 。 构建 一 个 完整 的 模型 。》 如 何 把 这 些 物性 中 的 


3. 当 使 用 透视 投影 时 , 场景 中 的 球 在 什么 条 件 下 
不 会 在 投影 平面 上 产生 一 个 圆圈 ? 

4. 当 使 用 透视 投影 时 , 直线 段 的 图 像 能 变 成 投影 
平面 上 的 曲线 段 吗 ? 证 明 你 的 答案 。 

5. 假设 8 英尺 直 柱 的 一 端 距离 投影 中 心 4 英 尺 ， 


一 个 特性 添加 到 模型 中 ? 


:三维 空间 中 的 任意 4 个 点 能 是 多 边 形 网 格 中 的 


面 片 的 顶点 吗 ? 阐释 你 的 答案 。 


:下面 的 每 个 集合 都 表示 了 一 个 多 边 形 网 格 中 


面 片 的 项 点 〈 使 用 传统 的 直角 坐标 系统 ) ， 描 


而 且 假 设 从 投影 中 心 到 直 柱 一 端的 直线 与 投 述 网 格 的 形状 。 

影 平 面相 交 于 一 点 ， 这 一 点 距离 投影 中 心 ] 英 面 片 1，〈0，0，0) 区 区 

乒 ， 如 采 柱 体 与 投影 平面 平行 ,那么 在 投影 平 (2，0，0) 

面 里 柱子 的 图 像 长 度 是 和 多少? 面 片 2，〈0，0，0) 《1 4 导 “ 区 ，D， 的 
6. 曾 释 平行 投影 和 透视 投影 之 间 的 区 别 。 面 片 3， (3，0，0) 【1，1x 生生 。 瘟 站 ? 


中 1 英尺 =0.3048 米 。 一 编者 注 


% 尼 


让 
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面 片 4 (2，2，0) (1，1，1)》 (0，2，0) 
面 片 5S: 《0，23，0) (1，1，1)》 (0，0，0) 
: 下 甸 的 每 个 集合 都 表示 了 一 个 多 边 形 网 格 中 
雁 片 的 顶点 〈 使 用 传统 的 直角 坐标 系统 ) ， 描 
述 网 格 的 形状 。 
面 片 1 《0，0，0) 
2，D，D) 
《 间 ，D， 站 》 
《1，D0，1》 
面 片 3，(2，0，0) 
2，4，0) 
面 片 4 (0，0， 0) (1，0，1) 《2，0，0) 
面 片 3:， (2，4,，0) (1,，4，1)》 (0，4，0) 
. 设计 表示 长 方 体 的 多 边 形 网 孔 , 使 用 传统 的 直 
角 坐 标 系统 来 表示 顶点 , 绘制 出 一 幅 草 图 表示 
你 的 解决 方案 。 
. 使 用 不 超过 8 个 三 角 片 ， 设 计 移 边 形 网 格 ， 去 
近似 半径 为 1 的 球 的 形状 。( 只 有 8 个 面 片 ， 你 
的 网 格 将 是 非常 粗糙 的 球 近似 , 但 物体 是 向 你 
屡 示 对 什么 是 多 边 形 网 格 的 理解 , 而 不 是 产生 
球 的 精确 表示 。) 使 用 传统 的 直角 坐标 系统 表 
示 你 的 面 片 的 顶点 ， 绘 制 出 你 的 网 孔 的 草图 。 
. 为 什么 下 面 4 个 点 不 是 平面 片 的 顶点 ? 
0 D DO (1，0，0) 
(DO，1，0) (0，0，1) 
. 假设 顶点 (1，0,， 0) 、(1，1，1)》 和 1，0， 
2) 慧 平面 片 的 顶点， 下面 哪个 线段 是 面 片 表 
面 的 法 线 ? 
3a. 从 【1，0，0) 
b. 从 (1，1，1) 


( 口 ，4， 门 ) 《2， 汪 ， 昌 ) 


面 片 2: 《0，4，0) 《1，4，1) 


1，0， 1 (L，4，1) 


到 〔〈1，1，0) 的 线段 
到 《〈2，1，1) 的 线段 
c, 从 (1，0，2) 到 (0，0，2) 的 线段 
d. 从 (1，0，0) 到 (1，1，1) 的 线段 
， 倍 出 程序 化 模型 的 两 种 “类 型 ”。， 

. 在 建 模 过 程 和 演 染 过 程 之 间 ， 哪 一 个 更 是 
a，、 标 准 化 任务 ? 

b. 以 计算 为 主 的 任务 ? 

c. 创造 性 任务 ? 

证 明 你 的 答案 。 

- 下 列 哪 一 个 可 能 被 表示 在 场景 图 中 ? 

a， 光源 

b. 不 动 的 道具 

cc 人物 /演员 

d， 相 机 

' 在 何 种 意义 上 说 场景 图 的 创建 是 3D 图 形 学 处 
理 的 关键 步骤 ? 


2 


了 


24， 


3， 


20. 


之 /. 


28. 
2 


6 


30. 


3 


一 一 


32. 


场景 图 中 的 相机 可 能 改变 位 置 和 朝向 , 这 个 问 
古 引 入 了 何 种 复杂 性 ? 

假设 带 有 顶点 (0，0，0) 、(0，2，0) 、(2， 
2，0)》 和 (2，0，0) 的 平面 片 是 平滑 且 有 光 
泽 的 。 如 果 一 条 从 点 〈0，0，1) 发 源 的 光线 ， 
在 〈1，1，0) 处 入 射 表面 ， 反 射线 将 经 过 下 
列 的 哪个 点 ? 

3a 【0，0，1》 

b. 《1，1，1) 

C. 《2，2，17 

d. 《3，3，1) 

假设 一 个 浮标 上 支撑 着 一 个 离 静止 水 面 高 10 
英 扩 的 灯 , 如 果 有 一 观察 者 离 浮 标 15 英 斥 ， 离 
水 面 融 5 英尺， 在 水 面 的 哪个 点 上 ， 观 察 者 将 
看 到 灯 的 反射 ? 

如 果 一 条 鱼 在 静 目 水 面 下 游 动 , 观察 者 从 水 面 
上 看 鱼 ， 从 观察 者 的 位 置 来 说 ， 鱼 将 显示 为 ， 
a. 在 它 的 真实 位 置 的 上 方 且 向 着 背景 方向 ; 
b， 在 真实 的 位 置 ; 

c. 在 它 的 真实 位 置 的 下 方 且 向 着 前 景 方向 。 
假设 点 (1，0,， 0) 、(〈1，1，1) 和 (1，0， 
24 古 平 面 片 的 顶点 ， 并 且 从 物体 外 面 观看 
时 项 点 是 以 道 时 针 顺 序 依 次 排列 。 在 每 种 情 
岂 下 《从 物体 外 或 物体 内 部 观看 ) ， 指 明 从 
所 给 出 的 点 发 出 的 光线 是 否 会 与 面 片 的 表 
面相 交 。 

a.《 昨 ，0，D0) 

b. (2，0，0) 

CC. 《2，1，1]) 

d.〈《3，2，1) 

尝 一 个 例子 , 说 明 视 体外 的 物体 能 够 出 现在 最 
终 图 像 中 。 

描述 z 缓 冲 区 的 内 容 和 用 途 。 

在 针对 隐藏 面 消除 的 讨论 中 ， 借 助 z 钥 冲 区 我 
们 描述 了 解决 “前 景 /背景 ”问题 的 步骤 。 用 
第 5 章 介绍 的 伪 代 码 表 示 这 个 过 程 。 

假设 物体 的 表面 被 交替 的 橙色 和 蓝 色 坚 条 级 
敌 丫 ， 每 一 个 都 是 1 厘米 的 宽度 ， 如 果 这 个 目 
标 被 放置 在 场景 中 , 这 样 像素 的 位 置 与 物体 上 
的 占据 2 厘米 空间 的 点 相关 联 , 在 最 终 图 像 中 ， 
物体 的 可 能 显示 是 什么 ? 


' 虽然 纹理 酉 射 和 弹性 映射 都 是 与 表面 “纹理 ” 


相关 的 方法 , 但 它们 是 相当 不 同 的 技术 , 写 出 
简短 的 段落 来 对 它们 进行 比较 。 
列 出 得当 流水 线 的 4 个 步骤 , 并 给 出 简要 说 明 。 


课外 阅读 325 
33, 使 用 硬件 /固件 实现 泻 染 流水 线 有 哪些 优点 ? 有 哪些 缺点 ? 
34. 设计 为 交互 式 视 频 游 戏 的 计算 机 的 硬件 与 通 40. 如 果 用 传统 光线 跟踪 生成 的 场景 图 像 与 用 辐 
用 PC 的 硬件 在 方式 上 有 什么 不 同 ? 射 度 生 成 的 相同 场景 的 类 似 图 像 相 比较 , 两 幅 
35. 传统 泻 染 流水 线 的 主要 限制 是 什么 ? 图 像 有 何 异 同 ? 
36. 局 部 照明 模式 与 全 局 照明 模式 之 间 的 区 别 是 41. 电影 院 放 映 的 90 分 钟 动画 产品 需要 多 少 帧 ? 
什么 ? 42. 描述 粒子 系统 是 如 何 被 用 来 产生 火苗 闪烁 的 
37. 光线 跟踪 与 传统 的 泻 染 流水 线 相 比 有 哪些 优 动画 的 。 
点 ， 有 哪些 缺点 ? 43. 当 创 建 一 个 描述 单个 物体 在 场景 中 移动 的 动 


38. 


3 区. 


分 布 式 光线 跟踪 与 传统 的 光线 跟踪 相 比 有 哪 
些 优点 ， 有 哪些 缺 所? 
辐射 度 与 传统 的 演 染 流水 线 相 比 有 哪些 优点 ， 


国友 列 时 ， 解 释 z 缓 冲 区 的 使 用 有 何 帮助 。 


.当今 的 动画 制作 者 的 任务 与 以 前 的 动画 制作 


者 之 间 有 哪些 不 同 ? 


县 区 PP 于 mm 
下 和 


ER 
1 ] 题 


下 列 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 这 些 问 题 不 是 

唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回 答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 假设 计算 机 动画 到 达 了 在 影视 行业 中 不 再 需要 真实 演员 的 地 步 ， 那 结果 将 是 什么 ? 不 再 
有 “电影 明星 ”会 带 来 什么 样 的 影响 ? 

2. 随 看 数码 相机 和 相关 软件 的 发 展 ， 大 众 已 经 可 以 改变 和 制作 照片 。 
变化 ? 会 引起 哪些 伦理 和 法 律 问 题 ? 

3. 照片 所 有 权 的 程度 是 什么 ? 假设 一 个 人 在 网 站 上 放置 了 他 的 《〈 她 的 ) 照片 ， 另 一 些 人 下 
载 了 这 张 照片 并 修改 了 它 ， 因 此 ， 主 体 处 在 妥协 的 状况 ， 后 来 流行 的 是 改变 后 的 版 本 ， 
照片 的 主体 应 该 拥有 什么 追 索 权 ? 

4. 帮助 开发 暴力 视频 游戏 的 程序 员 应 该 对 此 游戏 产生 的 任何 后 果 负 有 何 种 程度 的 责任 ? 
是 否 应 该 限制 儿童 接触 此 类 游戏 ? 如 果 是 的 话 ， 应 如 何 限制 以 及 由 谁 来 限制 ? 对 社会 上 
其 他 一 些 特殊 的 团体 〈 如 罪犯 ?， 应 该 采取 何 种 限制 ? 


这 将 给 社会 寓 来 何 种 


ge 二 
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人 工 智 能 


和 章 探 讨 计算 机 科学 的 一 个 分 支 ;人工 智能 。 尽 管 该 领域 仍然 处 于 发 展 的 初期 阶段 ， 

但 它 已 经 产生 了 一 些 令 人 惊讶 的 结果 ， 例 如 ， 机 器 象棋 大 师 ， 用 来 学 习 和 推理 的 计 
拭 机 ， 协 调 一 致 来 完成 一 个 共同 的 目标 〈 如 赢得 一 场 足 球 比赛 ) 的 多 个 机 器 。 在 人 工 智能 领域， 
今天 的 科学 想象 也 许 在 明天 就 会 变 成 现实 。 

人 工 智 能 是 计算 机 科学 的 一 个 领域 ， 旨 在 寻求 建造 自主 的 机 器 一 一 无 需 人 为 干预 就 能 完 
复杂 任务 的 机 器 。 这 个 目标 要 求 计算 机 能 够 感知 和 推理 ， 虽 然 这 对 于 人 脑 来 说 是 天 生 的 ， 但 属 
于 向 识 行为 范畴 的 这 两 种 能 力 对 于 机 器 来 说 却 是 有 困难 的 。 结 果 是 该 领域 的 工作 持续 面临 着 挑 
战 。 本 章 就 来 探讨 这 个 广阔 研究 领域 中 的 一 些 主题 。 


让 二 下 


站 了 | 


人 工 智 能 领域 十 分 广阔 ， 并 且 与 其 他 学 科 相 融合 ， 如 心理 学 、 神 经 学 、 数 学 、 语 言 学 以 及 
电子 与 机 械 工 程 等 学 科 。 为 了 让 思考 更 集中 ， 我 们 从 考虑 智能 体 的 概念 以 及 智能 体 可 能 时 现 的 
镶 能 行为 类 型 着 手 。 实 际 上 ， 人 工 智 能 的 许多 研究 都 可 归 类 于 一 种 智能 体 的 行为 。 


11.1.1 智能 体 


智能 体 〈agent) 是 对 环境 的 刺激 做 出 响应 的 一 种 “装置 ”。 很 自然 地 会 把 一 个 智能 体 想象 
为 一 个 像 机 器 人 这 样 的 单个 机 器 ， 尽 管 它 可 以 采用 别 的 形式 ， 如 一 架 自 动 飞机 、 交 互 武 视频 
洲 戏 里 的 一 个 角色 或 是 通过 因特网 通信 的 过 程 〈 可 能 作为 客户 机 或 服务 器 )。 大 多 数 智能 体 具 
有 传感器 和 效应 器 ， 前 者 接收 来 自 环境 的 数据 ， 后 者 对 环境 做 出 反应 。 传 感 器 包括 麦克 风 、 
摄像 机 、 距 离 传感器 以 及 空气 或 土壤 采样 设备 等 。 效 应 器 的 例子 有 车 轮 、 腿 、 翅 膀 、 夹 子 以 
及 语音 合成 器 。 

很 多 人 工 智 能 的 研究 可 以 按照 智能 体 的 智能 行为 刻画 性 格 ， 这 意味 着 智能 体 激励 者 的 动作 
必须 对 通过 感应 器 接收 的 数据 做 出 合理 的 响应 ， 通 过 考虑 这 些 不 同 级 别 的 响应 ， 我 们 可 以 将 其 
分 类 。 

最 简单 的 响应 是 轴 射 行为 ， 这 只 是 对 输入 数据 的 一 个 预定 的 响应 。 更 高 级 的 响应 需要 获取 
更 智能 的 行为 。 例 如 ， 我 们 可 以 赋予 智能 体 以 环境 知识 ， 要 求 其 调整 相应 的 行为 。 投 扼 棒 球 的 
过 程 是 映射 行为 ， 但 决定 怎样 扔 ， 向 哪个 方向 扔 ， 就 需要 对 当前 环境 有 一 定 的 了 解 。( 如 一 个 人 
出 局 ， 跑 手 在 一 又 和 三 人 刍 。) 怎么 样 存储 、 更 新 和 获取 这 种 现实 世界 的 知识 ， 然 后 最 终 应 用 到 决 
策 过 程 中 ， 这 仍然 是 人 工 智 能 领域 具有 挑战 性 的 问题 。 

如 果 我 们 希望 智能 体 寻求 的 目标 是 赢得 一 场 棋 赛 或 是 蚁 晓 通 过 一 条 拥挤 的 通道 ， 那 么 就 需 
要 尺 一 种 层次 的 响应 。 这 种 有 目标 性 的 行为 需要 智能 体 的 响应 〈 或 是 一 系列 的 响应 ) 应 当 是 周 
密 考 虑 的 结果 ， 构 成 一 个 行为 计划 ， 或 是 在 当前 的 各 种 选项 中 选取 最 好 的 行为 。 
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在 有 些 情况 ， 随 着 智能 体 不 断 学 习 ， 它 的 响应 能 够 不 断 地 得 到 改进 。 这 可 以 采取 不 断 发 展 
的 过 程 性 知识 (procedural Knowledge) 学习“ 怎样 ”) 的 方式 ,或 者 储备 陈述 性 知识 (declarative 
knowledge) (学 习 “ 什 么 习 的 方式 。 学 习 过 程 性 知识 涉及 一 个 反复 试验 过 程 ， 在 这 个 过 程 中 ， 
智能 体 从 出 错 受罚 、 正 确 受 奖 的 过 程 中 学 习 适 当 的 反应 。 根 据 这 个 方法 开发 了 一 些 智能 体 ， 它 
们 能 够 随 着 时 间 改 进 在 诸如 跳棋 和 国际 象棋 这 种 竞赛 性 游戏 中 的 能 力 。 学 习 陈 述 性 知识 通常 采 
取 的 形式 是 扩充 或 变更 智能 体 的 知识 存储 器 里 的 “事实 ” 例如 ， 一 个 棒球 运动 员 必 须 不 断 地 重 
复 调整 其 知识 数据 库 〈 虽 然 还 是 一 球 已 出 ,但 现在 跑 鱼 手 在 第 一 侍 和 第 一 笃 )， 从 中 对 将 来 的 二 
件 做 出 合理 响应 。 

一 个 智能 体 要 对 刺激 做 出 合理 的 响应 ， 它 必须 “理解 ” 由 其 传感器 接收 的 刺激 。 也 就 是 说 ， 
智能 体 必 须 能 够 从 其 传感器 产生 的 数据 里 提取 信息 ， 换 名 话说， 智能 体 必 须 能 够 感知 。 有 些 情 
况 下 ， 这 是 一 个 直接 的 过 程 。 从 一 个 陀螺 仪 获取 的 信号 很 容易 就 能 编码 成 适合 计算 的 形式 ， 以 
确定 响应 。 但 是 有 些 情况 下 ， 从 输入 数据 提取 信息 并 不 容易 ， 例 如 理解 说 话 和 理解 图 像 就 很 难 。 
同样 ， 智 能 体 也 必须 能 够 以 与 效应 器 的 方式 表达 它们 的 响应 。 这 可 以 是 一 个 直接 的 过 程 ， 也 可 
能 要 求 智能 体 把 其 响应 表达 为 一 句 完整 的 口语 句子 一 “这 意味 着 智能 体 必 须 生成 语音 。 所 以 ， 
像 图 像 处 理 和 分 析 、 自 然 语 言 理 解 以 及 语音 发 生 这些 主 题 都 是 重要 的 研究 领域 。 

我 们 这 里 识别 的 智能 体 的 属性 既 表 示 以 前 的 研究 范畴 ， 又 表示 当今 的 研究 范畴 。 当 然 ， 它 
们 彼此 之 间 并 不 是 完全 无 关 的 。 我 们 希望 最 终 能 够 开发 出 处 理 所 有 这 些 属性 的 智能 体 ， 产 生出 
能 够 理解 来 自 环境 的 数据 ， 并 通过 学 习 过 程 发 展 新 的 响应 模式 的 智能 体 ， 学 习 的 目的 是 最 大 限 
度 地 提高 智能 体 的 能 力 。 然 而 ， 通 过 孤立 各 种 推理 行为 并 独立 研究 它们 ， 研 究 人 员 获 得 了 一 个 
立足 点 ， 该 立足 点 今后 可 以 与 其 他 领域 的 发 展 相 结合 ， 产 生 更 加 智能 的 智能 体 。 

本 节 的 最 后 我 们 介绍 一 个 智能 体 ， 也 将 为 11.2 节 和 11.3 节 的 讨论 提供 一 个 背景 。 该 智能 体 是 
为 解决 8 数码 游戏 〈eight-puzzle) 而 设计 的 ， 该 游戏 由 8 个 小 方块 组 成 ， 标 号 为 1 到 8， 放 置 在 [505 
个 3 行 3 列 总 共 可 容纳 9 个 小 方块 的 框架 内 〈 见 图 11-1)。 这 样 ， 框 内 的 方块 间 有 个 空位 ， 任 何 邻 
接 的 方块 可 以 推移 ， 允 许 框 内 的 方块 随意 排 布 。 问 题 是 要 把 杂乱 布 放 的 方块 移 回 到 它们 初始 的 


位 置 《 见 图 11-1)。 

我 们 的 智能 体 采用 如 图 11-2 所 示 的 这 样 一 种 装置 ， 该 装置 配备 有 一 个 夹具 、 一 个 摄像 机 和 
一 个 这 橡 皮 头 的 指 杆 ， 橡 皮 是 为 了 推移 东西 时 不 会 打滑 〈 见 图 11-2)。 当 首次 开启 该 智能 体 时 ， 
夹具 会 张 合 ， 好 像 要 这 个 拼图 一 样 。 当 我 们 把 一 个 随意 排 布 的 拼图 放 进 夹具 时 ， 夹具 就 会 把 它 
夹 住 。 不 一 会 ， 机 器 的 指 杆 降低 ， 并 开始 在 框架 内 推移 方块 ， 直 到 所 有 的 方块 回复 到 原始 位 置 。 


这 时 ， 机 器 就 放 开 拼 板 并 自己 关 掉 电 源 。 








ea 


图 11-1 8 块 拼图 的 最 终 布 局 图 11-2 解雇 8 数码 游戏 的 机 器 


上 


| 
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这 个 解决 8 数码 游戏 的 机 器 展现 了 已 经 提 到 过 的 两 个 智能 体 的 属性 。 第 一 , 它 必 须 能 够 感知 ， 
下 是 必须 从 摄像 机 拍摄 的 图 像 中 获取 当前 拼图 的 状态 。 我 们 将 在 11.2 节 曾 述 理解 图 像 的 问题 。 
第 二 ， 它 必须 开发 和 实现 一 个 达到 目标 的 计划 。 这 些 问 题 将 在 11.3 节 中 阐述 。 


11.1.2 研究 方法 


要 对 人 工 智能 领域 作出 客观 的 评价 ， 应 该 知道 对 该 领域 的 研究 存在 两 种 路 线 。 一 种 可 以 称 
为 工程 线路 ， 即 研究 人 员 侧重 于 开发 展示 智能 行为 的 系统 。 另 一 种 可 以 称 为 理论 路 线 ， 即 研究 
人 员 倾 向 于 研究 动物 〈 尤 其 是 人 类 ) 智能 。 两 种 研究 路 线 必 然 导 致 不 同 的 研究 结果 。 在 工程 路 
线 指 导 下 ， 由 于 潜在 目标 是 生产 出 符合 某 种 性 能 目标 的 产品 ， 因 此 就 产生 了 以 性 能 为 异 向 的 方 
法 论 。 而 在 理论 路 线 指导 下 ， 由 于 潜在 目标 是 增进 人 类 对 计算 智能 的 理解 ， 关 注重 点 是 底层 处 
理 而 非 外 在 性 能 ， 结 果 就 产生 了 面向 模拟 的 方法 论 。 

作为 一 个 例子 ， 考 虑 自然 语言 处 理 和 语言 学 领域 。 这 些 领域 关系 密切 ， 研 究 成 果 相 得 益 
彩 ,但 它们 的 深层 目标 却 不 同 。 语 言 学 家 的 兴趣 在 于 弄 明 白人 类 如 何 处 理 语言 ,而 自然 语言 
处 理 领域 的 研究 者 的 兴趣 在 于 开发 能 处 理 自然 语言 的 机 器 。 所 以 ， 语 言 学 家 以 面向 模拟 的 
合式 运作 一 一 建造 用 来 检验 理论 的 系统 。 相 反 ， 自 然 语 言 处 理 的 研究 者 以 面向 性 能 的 模 武 运 
作 一 一 建造 执行 任务 的 系统 。 后 一 种 模式 产生 的 系统 (如 文档 翻译 机 和 响应 口头 命令 的 机 器 
系统 ) 在 很 大 程度 上 依赖 于 语言 学 家 获取 的 知识 ,但 对 于 特定 系统 的 限定 环境 常 加 以 “ 抄 近 
路 ”的 简化 。 

作为 一 个 基本 的 例子 ， 考 虑 为 一 个 操作 系统 开发 一 个 外 壳 〈shell) 的 任务 ， 它 通过 口述 黄 
语 命令 接收 来 自 外 部 世界 的 指令 。 在 这 种 情况 下 ，shell (一 个 智能 体 ) 不 需要 考虑 完整 的 英语 
语言 。 更 准确 地 说 ， 外 壳 不 需要 区 分 copy 这 个 词 的 不 同意 思 〈 是 名 词 还 是 动词 ? 是 否 有 抄袭 的 
合 义 ? )。 相 反 ， 外 这 仅仅 需要 把 copy 这 个 词 与 其 他 命令 〔〈 如 rename、delete ) 区 分 开 来 就 行 。 
所 以 外 壳 只 要 将 输入 与 预先 确定 的 声音 模式 对 比 ， 就 能 够 执行 它 的 任务 。 这 样 -一 个 系统 的 性 能 
可 能 会 令 人 满意 ， 但 在 审美 意义 上 也 许 不 能 令 语言 学 家 满意 。 


11.1.3 ”图 灵 测 试 
过 去 ， 图 灵 测 试 (Turing test) (1950 年 由 阿兰 。 图 灵 提 出 ) 一 直 作为 衡量 人 工 智能 领域 
的 进展 时 的 一 种 基准 。 图 灵 的 提议 是 ， 允 许 一 个 人 《〔〈 我 们 称 他 为 询问 者 ) 与 一 个 测试 对 象 通 


过 一 个 打字 机 系统 进行 道 信 , 而 没有 告知 询问 者 测试 对 象 究竟 是 一 个 人 还 是 一 台 机 器 。 在 这 
个 环境 中 , 如果 询问 者 没 能 够 把 一 台 机 器 与 一 个 人 区 分 开 来 , 那么 可 以 宣称 这 人 台 机 器 的 行为 


”是 智能 的 。 图 灵 预 测 ， 到 2000 年 ， 机 器 将 会 有 30 旬 的 机 会 通过 一 个 5 分 钟 的 图 灵 测 试 - 一 这 


个 预见 恢 人 的 准确 。 


人 工 智能 的 起 源 

可 求 建造 能 够 模仿 人 类 行为 的 机 器 有 很 长 的 历史 ， 不 过 很 多 人 会 认同 现代 人 工 智 能 领域 
起 源 于 1950 年 。 就 在 这 一 年 ,阿兰 .图 灵 发 表 了 论文 Computing Machinery and Intelliigence”， 
提出 机 器 能 够 通过 编程 来 展现 智能 的 行为 。 这 个 领域 的 名 字 -- 一 人 工 上 能 一 一 就 在 几 年 后 由 
约 畦 ， 赤 卡 锡 (John MecCarthy ) 在 一 个 现在 看 来 非常 具有 传奇 彩 的 建议 里 提出 ， 他 建议 “1956 
年 夏天 在 达 特 茅 斯 学 院 ( Dartmouth College ) 开展 人 工 智能 的 研究 ”， 以 探究 “这 种 推测 ， 即 
认为 认 知 的 每 个 方面 或 智能 的 任何 其 他 特征 原则 上 都 能 够 被 精确 地 描述 ， 从 而 能 够 制造 出 模 
拟 它 的 机 器 ”， 
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图 灵 测 试 已 不 再 被 认为 是 智能 有 意义 的 度量 ， 其 中 一 个 原因 在 于 ,一 个 怪诞 的 智能 显示 可 以 
用 相对 简单 的 手法 生产 (produce) 出 来 。 图 灵 测 试 场景 的 一 个 著名 示例 是 20 世 纪 60 年 代 中 期 由 
Joseph Weizenbaum 开 发 的 程序 POCTOR 更 通用 的 一 个 版 本 称 系 统 为 BELIZA)。 这 个 交互 程序 
被 设计 用 来 反映 一 种 指导 心理 医疗 的 罗杰斯 心理 分 析 的 景 消 ; 计算 机 扮演 了 分 析 师 的 角色 ， 而 
用 户 扮演 病人 。 在 内 部 ， DOCTOR 所 做 的 一 切 是 根据 某 些 明确 的 规则 将 病人 的 陈述 重新 构造 夫 
反馈 给 病人 。 例 如 ， 回 应 病人 的 陈述 “我 今天 觉得 很 系 ， DOCTOR 可 能 回答 “为 什么 你 今天 觉 
得 很 累 ?_ ”如果 DOCTOR 不 能 识别 句子 结构 ， 它 仅仅 作出 像 “继续 ” 或 独 “这 很 有 趣 ” 这 样 的 
啊 应 。 

Weizenbaum 开 发 DOCTOR 的 目的 是 为 了 研究 自然 语言 沟通 。 心理 疗法 的 目标 仅仅 提供 了 一 
个 程序 可 以 “沟通 ”的 环境 。 然 而 ，Weizenbaum 没 有 想到 的 是 ， 个 别 的 心理 学 家 建议 把 这 个 程 
序 用 在 实际 的 心理 治疗 中 。( 罗杰斯 的 论点 是 ， 在 治 尊 期间， 应 该 是 病人 来 主导 对 话 ， 而 不 是 分 
析 师 。 所 以 他 们 认为 计算 机 也 能 像 治 疗 师 那 样 引导 对 话 。) 而 用， DOCTOR 表 现 出 的 理解 的 景象 
如 此 强 以 致 许多 与 它 “ 沟 通 ” 过 的 人 变 得 依赖 于 这 种 与 机 器 的 问答 却 对 语 。 在 某 种 意义 上 ， 
DoOcTOR 通 过 了 图 灵 测 试 。 其 结果 是 ， 在 伦理 及 技术 上 都 产生 了 争议 ，Weizenbaum 成 为 一 位 在 
这 个 技术 进步 的 世界 中 维护 人 类 得 严 的 提倡 用 。 0 

较 新 的 图 灵 测 试 “ 成 功 ” 的 例子 包括 因特网 病毒 ， 病毒 为 了 诱骗 人 类 放弃 对 亚 意 软件 的 防 
护 ， 它 用 人 类 受害 者 来 传输 病毒 的 “智能 ” 变 体 。 此 外 ， 与 图 灵 测 试 类 似 的 现象 发 生 在 像 下 棋 
这 样 的 计算 机 游戏 的 场景 中 。 尽管 这 些 程 序 选 择 棋 路 仅仅 通过 应 用 亦 力 技术 (这 与 我 们 将 在 11.3 
节 讨 论 的 内 容 相 人 羽 )， 但 人 类 在 同 计算 机 的 竟 赛 过 程 中 常 感觉 机 器 拥有 创造 力 甚至 个 性 。 相 似 的 
感觉 发 生 在 机 器 人 技术 领域 ， 根 据 自然 属性 建造 的 机 器 表现 出 了 智能 的 特征 。 例 如 ， 玩具 机 器 
狗 ， 仅 仅 通过 点 头 或 者 是 竖 耳 共 来 响应 声音 ， 呈 现 了 可 爱 的 个 性 。 


问题 与 练习 

. 指出 一 个 智能 体 可 能 会 做 的 凡 种 “智能 ”动作 。 

一 棵 放 在 只 有 一 束 光 源 的 瞳 室 里 的 植物 , 它 就 朝 着 这 东 光 源 方 向 生长 。 这 是 一 种 智能 啊 应 吗 ? 植物 拥 
有 智能 吗 ? 那么 ， 你 对 智能 的 定义 是 什么 ? 

_ 假定 一 台 售 货机 根据 所 按 的 按钮 发 售 不 同 的 物品 。 你 认为 这 样 的 一 台 机 器 是 否 “ 知 道 ” 被 技 了 哪个 按 
钮 ? 你 对 “知道 ”的 定 尽 是 什么 ? 

.如 果 一 台 机 器 通过 了 图 灵 测 试 ,你 会 认同 这 人 台 机 器 是 智能 的 吗 ? 如 果 不 是 , 你 是 : 认同 该 机 器 看 上 去 
是 智能 的 ? 


本 


La 


卫 


国 于- e 二 js 一 人 =- 


一 个 智能 体 要 智能 地 响应 从 它 的 传感器 接收 的 输入 ， 它 必须 能 够 理解 输入 。 也 就 是 说 ， 税 
能 体 必 须 能 够 感知 。 本 节 我 们 来 探讨 感知 的 两 个 已 经 证 明 是 特别 具有 挑战 性 的 研究 领域 一 理 
解 图 像 和 理解 语言 。 


11.2.1 理解 图 像 


让 我 们 考虑 11.1 节 介绍 的 解决 8 数码 游戏 的 机 器 所 提出 的 问题 。 机 器 上 夹具 的 张 合 没有 
表现 出 严重 的 障碍 , 在 这 个 张 合 的 过 程 中 ,因为 这 里 的 应 用 要 求 的 精度 不 高 ， 所 以 检测 夹具 
中 是 和 否 有 拼图 的 功能 也 很 简单 ,即使 摄像 机 对 拼图 的 对 焦 问 题 也 不 难 通过 设计 夹具 把 拼图 安 
置 在 一 个 事先 确定 的 位 置 来 加 以 解决 。 所 以 , 机 器 需要 的 第 一 个 智能 行为 是 从 一 个 视觉 媒介 
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中 提取 信息 。 


企 解 决 8 数码 游戏 的 机 器 的 案例 中 ， 对 拼图 图 像 的 可 能 解释 是 相对 有 限 的 。 我 们 可 以 假定 ， 
在 一 个 排列 好 的 模式 里 所 呈现 的 总 是 一 幅 包 含 数 字 1 到 8 的 图 像 。 问题 只 是 去 提取 这 些 数字 的 排 
列 。 为 此 ， 我 们 想象 拼图 的 图 像 已 经 在 计算 机 存储 器 中 ， 按照 位 进行 编码 。 编 码 中 的 每 一 位 表 
示 且 体 像 素 的 亮度 。 假 定 图 像 的 大 小 统一 《机 器 把 拼图 放 在 摄像 机 前 预定 的 位 署 )， 通过 把 图 像 
的 不 同 部 分 3 用 在 拼图 中 的 单个 数字 产生 的 位 模式 构成 的 预定 模板 相 比较 ， 机 器 就 能 够 检测 出 
哪个 方块 在 哪个 位 置 。 如 果 发 现 匹配 ， 则 说 明 拼 图 达到 了 要 求 的 状况 。 

这 种 图 像 识别 技术 是 光学 字符 阅读 器 中 使 用 的 一 种 方法 . 但 它 是 有 缺点 的 ， 它 对 被 读 的 符 
号 在 类 型 、 大 小 以 及 方位 上 要 求 一 定 程度 上 的 一 致 性 特别 是 ， 即 使 对 于 相同 的 符号 ， 外 形 也 
相同 ， 但 字体 较 大 的 字符 产生 的 位 模式 与 较 小 字体 的 模板 也 不 匹配 。 此 外 ， 可 以 想象 的 是 ， 当 
试图 处 理 手 写 材 料 时 ， 问 题 会 变 得 非常 困难 。 

解 次 字符 识别 问题 的 另 一 个 方法 是 基于 匹配 几何 特征 ， 和 而 不 十 答 号 的 精确 外 形 。 在 这 种 情 
凯 下 ， 数 字 1 表 示 为 一 条 单 竖 线 ， 数字 2 可 能 代表 一 条 不 封闭 的 曲线 ， 帮 部 与 一 条 水 平 直 线 相 连 ， 
等 等 。 这 种 符号 识别 的 方法 分 两 步 ; 第 一 步 是 从 要 处 理 的 图 像 中 提取 图 像 特 征 ， 第 二 步 是 把 这 
些 特 征 与 已 知 符号 的 特征 进行 比较 。 与 模式 匹配 方法 - - 样 ， 这 种 符号 识别 技术 并 不 可 靠 。 例 如 ， 
镜像 的 少许 错误 会 产生 一 组 完全 不 同 的 几何 特征 ， 比如 区 分 字母 0 和 C 的 情况 ， 以 及 8 数码 游戏 
里 的 数字 3 和 8。 

在 8 数码 游戏 中 我 们 比较 幸运 的 是 不 需要 理解 一 般 三 维 图 像 。 例 如 ， 我 们 拥有 的 便利 条 件 是 ， 
你 证 识别 的 形状 (数字 1 到 8) 相互 孤立 地 处 在 图 像 上 的 不 同 部 分 ， 而 不 是 一 般 常 见 重 嫩 的 图 像 。 
例如 ， 在 一 张 普 通 的 照片 中 ， 面临 的 不 仅 是 从 不 同 的 角度 识别 一 个 对 象 的 问题 ， 还 包括 隐藏 在 
视线 背后 的 对 象 的 某 些 部 分 。 

理解 一 般 图像 的 任务 通常 采取 两 步 进行 处 理 ;〔11 图 像 处 理 〈(image processing)， 指 标识 图 
像 的 特征 :〈2) 图 像 分 析 (image analysis)， 指 对 这 些 特征 代表 什么 意思 的 理解 过 程 。 在 利用 符 
号 的 几何 特征 进行 识别 的 描述 中 ， 我 们 已 经 提出 了 二 分 法 的 处 理 方 法 。 在 这 个 过 程 中 ， 图 像 处 
理 代 表 标 识 在 图 像 中 发 现 的 几何 特征 的 过 程 ， 图 像 分 析 代 表 标 识 那 些 特征 的 含义 的 过 程 。 

图 像 处 理 带 来 大 量 研究 主题 。 一 个 是 轮廓 增强 ， 使 用 数学 技术 使 图 像 中 区 域 间 的 边界 线 
变 得 更 清晰 。 在 某 种 意义 上 ， 轮廓 增强 试图 将 照片 转换 成 线条 画 。 岛 像 分 析 的 另 一 个 活动 是 
区 域 碍 找 。 这 是 标识 图 像 中 区 域 的 过 程 ， 这 些 区 域 拥 有 共同 的 属性 ， 比 如 亮度 、 颜 色 或 者 纹 
理 。 这 样 的 一 个 区 域 很 可 能 代表 属于 一 个 对 象 的 一 部 分 。 (这 种 识别 区 域 的 能 力 使 得 计算 机 可 
以 给 老式 的 黑白 电影 着 上 彩色 。) 图 像 处理 领 域 还 包含 另 一 个 活动 一 一 滤波 ， 即 去 除 图 像 中 的 
肯 陷 的 过 程 。 滤波 使 图 像 中 存在 的 错误 不 会 混淆 其 他 图 像 处 理 步骤 ， 但 是 太 多 的 滤波 会 导致 
重要 信息 的 持 失 。 

滤波 、 轮廓 增强 以 及 区 域 发 现 都 是 用 来 标识 图 像 中 各 种 成 分 的 步骤 . 匈 像 分 析 是 确定 这 些 
成 分 代表 什么 ， 以 及 最 终 确定 这 个 图 像 代 表 什 么 的 过 程 。 这 里 我 们 还 要 面 对 从 不 同 视角 识别 被 
部 分 叫 挡 对 象 这 样 的 问题 。 图 像 分 析 的 一 个 方法 是 开始 假定 一 个 图 像 大 概 是 什么 ， 然后 尝试 把 
图 像 中 的 成 分 与 那些 猜测 的 对 象 相 联系 。 这 看 起 来 是 人 类 所 使 用 的 方法 。 例 如 ， 有 时 我 们 会 发 
现 ， 在 我 们 视觉 模糊 的 情况 下 识别 一 个 未 预料 的 对 象 是 很 困难 的 ， 但 是 一 旦 我 们 有 一 个 该 对 象 
可 能 是 什么 的 线索 ， 我 们 就 能 容易 地 识别 它 。 

与 一 般 图 像 分 析 相关 的 问题 特别 多 ， 芷 这 个 领域 还 有 许多 研究 要 做 。 实 际 上 ， 图 像 分 析 是 
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证 明 人 类 能 够 很 快 又 非常 容易 完成 的 任务 是 如 何 挑战 机 器 能 力 的 领域 之 一 。 


强人 工 智能 与 弱 人 工 答 能 

能 够 通过 对 机 咒 进 行 编程 来 展现 其 智能 行为 的 那 种 推测 能 力 被 认为 是 能 人 工 智能 ( weak 
AI )， 今 天 在 不 同 程度 上 已 经 被 大 众 所 接 受 。 人 但是， 机 器 能 够 通过 编程 而 装 得 智力 ， 亦 即 意 
识 的 那 种 推测 能 力 ， 则 被 认为 是 强人 工 智 能 (strong AI )。 这 种 人 工 物 能 受到 了 广泛 的 质疑 。 
强人 工 智 能 的 反对 者 认为 ， 机 器 在 本 质 上 与 人 类 不 同 ， 它 永远 不 能 像 人 类 那样 感受 爱 、 区 分 
对 错 ， 以 及 考虑 自我 。 然 而 ， 强 人 工 物 能 的 支持 者 认为 ， 人 类 的 头脑 是 由 许多 小 的 成 分 构成 ， 
每 个 成 分 都 不 是 人 ， 没 有 意识 ， 但 是 当 它 们 结合 在 一 起 就 成 了 人. 所 以 他 们 辩 称 ， 为 什么 同 
样 的 现象 就 不 可 能 出 现在 机 器 身上 呢 ? 

解决 强人 工 智能 争辩 的 难题 在 于 ， 智 能 和 意识 这 样 的 属性 是 内 在 特性 ， 不 能 够 直接 加 以 
确认 。 正如 阿兰 . 图 灵 指 出 的 一 样 ， 我 们 认为 其 他 人 属于 有 智能 的 是 国 为 他 们 的 行为 表现 出 
有 智能 一 一 即使 我 们 不 能 观察 到 它们 内 部 的 智力 状态 。 那 么 ， 如 果 机 器 也 呈现 外 在 的 意识 特 
性 ， 我 们 是 否 准备 认可 机 器 具备 同样 的 水 准 呢 ? 为 什么 是 ? 为 什么 不 是 ? 


11.2.2 语言 处 理 

理解 语言 是 感知 问题 的 另 一 个 已 证 明 的 具有 挑战 性 的 问题 .把 形式 化 的 高 级 程序 设计 语 
襄 翻 译 成 机 器 语言 〈( 见 6.4 节 ) 获得 的 成 功 使 早期 的 研究 人 员 认 为 ， 设 计 程 序 使 计算 机 具有 
理解 目 然 语 言 的 能 力 不 和 久 将 会 实现 。 实 际 上 , 翻译 程序 的 这 种 能 力 给 我 们 一 种 错觉 一 一 机 器 
真能 理解 被 翻译 的 语言 。( 回 忆 6.1 节 中 Grace Hopper 讲 的 故事 ， 那 个 经 理 以 为 她 正在 教 计算 
机 理解 德语 。) 

这 些 研究 人 员 没 有 明 自 形式 化 的 程序 设计 语言 与 英语 、 德 语 以 及 拉丁 语 这 些 自然 语言 之 间 
的 差异 。 程 序 设 计 语言 由 精心 设计 的 原 语 组 成 ， 每 个 语句 只 有 一 种 语法 结构 ， 只 有 一 种 意思 。 
相反 ， 目 然 语 言 的 一 个 语句 会 因为 上 下 文 的 不 同 ， 甚 至 交流 方式 不 同 而 有 多 种 意思 。 因 此 ， 人 
类 理解 目 然 语言 很 大 程度 上 依靠 额外 的 知识 。 

例如 ， 句 子 

Norman Rockwell painted people. 

以 及 

Cinderella had a ball. 

者 有 多 种 意思 ， 但 通过 语法 分 析 或 单独 翻译 每 个 词 并 不 能 区 分 这 些 意思 。 实 际 上 ， 要 理解 这 些 
句子 需要 有 理解 句子 上 下 文 的 能 力 。 在 其 他 场合 ， 一 个 句子 的 真实 意思 与 它 的 字面 意思 完全 不 
同 。 例 如 “你 知 忠 几 扣 了 吗 ? ” 通 第 的 意思 是 “请 告诉 我 现在 几 点 了 。” 或 者 如 果 说 话 者 已 经 
等 候 了 很 长 时 间 ， 那 么 这 人 句 话 意思 可 能 是 “你 来 得 太 迟 了 。?” 

要 卉 明日 一 种 目 然 语 言 中 的 一 个 句子 的 意思 需要 几 个 层次 的 分 析 。 第 一 层 是 语法 分 析 
(syntactic analysis)， 其 主要 成 分 是 语法 分 析 。 在 这 里 ， 句 子 


Meary gave John a birthday card. 《玛丽 给 约翰 一 张 生 日 贺卡 。) 
的 主语 是 Mary， 而 句子 

John got a birthday card from Mary.〈 约 翰 收 到 玛丽 的 一 张 生日 贺卡 。) 
的 主语 是 John。 





有 
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分 析 的 第 二 层次 称 为 语 久 分 析 〈semantic analysis)。 语 法 分 析 仅 标识 每 个 词语 法 上 的 作用 ， 
与 语法 分 析 不 同 ， 语义 分 析 担 负 的 任务 是 标识 句子 中 的 每 个 词 在 语义 上 的 作用 。 一 义 分 析 试 图 
标识 这 样 的 内 容 ， 如 描述 的 动作 、 动 作 的 主体 〈 可 能 是 句子 的 主语 ， 也 可 能 不 是 ) 以 及 动作 的 
对 象 。 正 是 通过 语义 分 析 ， 句 子 “ 玛 丽 给 约翰 一 张 生 日 贺卡 ”和 “约翰 收 到 玛丽 的 一 张 生日 上 贺 
卡 ” 被 认为 是 在 说 同一 件 事 情 。 

分 析 的 第 三 层 是 上 下 文 分 析 (〈contextual analysis )。 在 这 个 层次 里 ， 句 子 的 上 下 文 被 引入 到 


- 姓 解 过 程 中 。 例 如 ， 很 容易 分 辨 出 句子 


The bat fell to the ground， 


中 的 每 一 个 单词 的 语法 上 的 作用 。 我 们 甚至 能 通过 识别 动作 “falling” 和 动作 主体 “bat” 等 等 
来 实现 语义 分 析 。 但 只 有 等 我 们 考虑 到 其 上 下 文 后 ， 句子 的 意思 才能 变 得 明确 。 尤 其 是 ， 这 名 
车 在 棒球 比赛 这 样 的 背景 下 和 在 洞穴 中 探险 这 样 的 背景 下 有 着 不 同 的 意思 @ 而 且 , 在 上 下 文 这 
个 层次 ， 问 题 “ 你 知道 几 点 了 ?” 的 真正 意思 才能 被 最 终 揭晓 。 

我 们 应 当 注 意 ， 各 个 层次 分 析 《〈 语 法 、 语 义 及 上 下 文 ) 并 不 一 定 相互 独立 对 于 句子 


Stampeding cattle can be dangerous. 


如 采 我 们 想象 是 一 群 牛 在 惊 跑 ， 那 么 主语 是 名 词 cattle 用 形容 词 stampeding 加 以 修饰 )。 但 是 如 
来 语 境 是 哪个 亚 作 剧 者 以 惊吓 牛 群 取乐 ， 规 么 主语 就 是 动 名 词 stampeding (宾语 是 cattle)。 因 此 ， 
这 个 句子 不 只 有 一 个 语法 结构 一 一 哪 一 个 是 正确 意思 依赖 于 上 下 文 。 

日 然 语言 处 理 的 另 一 个 研究 领域 关系 到 整个 文档 ， 而 不 是 单个 句子 。 这 里 涉及 的 问题 可 分 
成 两 类 : 信息 检索 〈information retrieval) 和 信息 提取 (〈information extraction)。 信 息 检 索 的 任 
务 是 标识 与 手头 论题 有 关 的 文档 。 一 个 例子 是 万 维 网 的 用 户 试图 找到 与 特定 主题 相关 的 站 点 时 
所 面 对 的 问题 。 该 技术 的 当前 状态 是 为 关键 字 搜索 站 点 ， 但 这 经 常 产生 大 量 的 错误 链接 ， 并 且 
由 于 其 处 理 “automobiles” 而 不 是 “cars” 它 会 忽略 一 个 重要 的 站 点 。 所 需要 的 就 是 理解 所 考 
虑 站 点 内 容 的 搜索 机 制 。 获取 这 样 的 理解 是 很 困难 的 ， 这 也 驶 是 许多 搜索 机 人 制 都 转向 采用 像 在 
4.3 玉 介绍 的 XML 这 样 的 技术 来 产生 一 个 万 维 语义 网 的 原因 。 

信息 提取 是 指 从 文档 中 提取 信息 这 样 的 任务 ， 并 采用 一 种 形式 以 方便 用 于 其 他 应 用 程序 。 
这 个 意思 可 以 理解 为 为 一 个 特定 的 问题 确定 答案 ， 或 者 是 将 信息 以 某 种 格式 记录 ， 以 备 日 后 
解答 问题 时 使 用 。 有 一 种 这 样 的 格式 称 作 模板 ， 这 种 模板 实质 上 是 一 种 记录 细节 的 调查 。 
例如 ， 考 虑 一 个 读 报 系统 。 该 系统 可 以 利用 各 种 各 样 的 模板 ， 报纸 上 的 每 一 类 文章 用 一 个 。 
如 果 系 统 鉴别 一 篇 文章 是 关于 入 室 盗窃 的 报道 ， 它 会 继续 试图 把 这 填写 到 入 室 资 窃 模板 中 ， 
该 模板 可 能 要 求 填写 这 样 一 些 条 目 ， 如 失窃 地 点 、 失 窗 时 间 和 日 期 以 及 失窃 物品 等 。 相 反 ， 
如 洒 系统 鉴别 一 篇 文章 是 关于 自然 灾害 的 报道 ， 那么 它 了 填写 自然 灾害 模板 ， 引 导 系 统 确定 
灾害 类 型 、 损 失 的 大 小 等 。 

信息 提取 者 记录 信息 的 另 一 种 形式 称 为 语义 网 Csemantic net)。 这 实质 上 是 一 个 大 的 链接 的 
数据 结构 ， 结构 中 的 指针 用 来 指出 数据 项 之 间 的 联系 。 图 11-3 显 示 了 一 个 语义 网 的 一 部 分 ， 帘 
出 显示 的 部 分 是 从 句子 

Mary hit John. 

中 得 到 的 信息 。 





册 英文 单词 bat 有 蝙蝠 和 球 棒 两 种 意思 ， 在 棒球 比赛 中 应 指 “ 球 棒 ” 在 洞穴 中 探险 时 则 可 能 指 “蝙蝠 
一 一 评 者 注 
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从 句子 Mary hit John. 中 得 到 的 信息 
图 11-3 ”一 个 语义 网 


而 
PE 
臣 


问题 与 练习 

1. 对 于 一 个 机 器 人 视频 系统 , 一 种 情况 是 机 器 人 用 其 来 操控 自己 的 活动 ， 忆 一 种 情况 是 将 其 传递 给 时 控 
机 器 人 的 人 。 这 两 种 情况 对 视频 系统 的 要 求 有 什么 不 同 ? 

2. 是 什么 让 你 知道 下 图 不 合 情 理 ? 这 样 的 洞察 怎样 编程 到 机 器 中 4 


. 下 图 中 有 几 个 方块 ? 怎样 对 一 个 机 器 编程 使 其 能 正确 回答 这 个 问题 ? 


| 


你 是 如 何 知道 句子 “Nothing is better than complete happiness” 和 句子 “人 A bowl of eold soup is better 由 an 
nothing” 不 是 暗 指 “A bowl of cold soup is better than on happiness' ?你 过 种 区 分 名 力 如 休 被 移 
号 指出 在 翻译 句子 “They are racing horses” 时 的 二 义 性 。 2 人 


6. 比较 下 列 两 个 句子 的 语法 分 析 结果 。 然 后 解释 二 者 在 语义 上 的 不 同 。 、 村 
The farmer built the fence in the field : 1 
The farmer built the fence in the winter. 0 外 人 0 


7. 基于 多 11-3 中 的 语义 网 ，Mary 和 John 之 问 是 什么 家 庭 关系 ? 


向 的 拓 秆 由 下 生计 和 生生 A 交 辣 生 生 PP HT 人 和 IE 二 后 RHeHEEHT=TeroHmeoacaniaoar 生机 VRH 下 站 FE 下 ES 导读 汪 生计 起 站 HE 生 卫 下 二 cg 站 Le 


11.3 推理 
现在 ， 让 我 们 来 利用 11.1 节 介绍 的 求解 8 数码 游戏 的 机 器 来 探讨 开发 具有 基本 推理 能 力 的 智 ”|515] 
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能 体 的 技术 。 
11.3.1 产生 式 系 统 


一 且 解 决 8 数码 游戏 的 机 器 从 看 到 的 图 像 中 解读 出 了 方块 的 位 置 , 它 的 任务 就 变 成 了 决定 需 
要 哪些 移动 来 求解 难题 。 马 上 可 以 想到 的 一 个 方法 是 ， 把 方块 所 有 可 能 排列 的 解决 方案 都 预先 
编制 到 机 器 中 。 然 后 ， 机 器 的 任务 就 只 是 选择 和 执行 合适 的 程序 。 然 而 ， 这 个 8 数码 游戏 有 几 和 干 
种 布局 ， 所 以 对 每 一 种 提供 一 个 直接 的 解决 方法 的 方案 显然 不 可 取 。 因 此 ， 我 们 的 目标 是 对 机 
器 编程 ， 让 机 器 能 够 自己 构建 难题 的 解决 方法 。 也 就 是 说 ， 必须 对 机 器 编程 使 其 能 够 实现 基本 
的 推理 活动 。 

开发 机 器 的 推理 能 力 已 经 是 一 个 研究 多 年 的 主题 。 有 关 这 方面 的 研究 已 经 形成 一 个 共识 ， 
印 有 一 大 类 推理 问题 具有 共性 ， 这 些 共性 被 孤立 在 在 一 个 抽象 的 实体 中 ， 该 实体 称 为 产生 式 系 
统 〈production system)。 这 种 系统 由 三 个 主要 部 分 组 成 。 

(1) 状态 集合 。 每 个 状态 〈state) 是 一 个 可 能 在 应 用 环境 中 发 生 的 情形 。 最 初 的 状态 称 作 开 
始 状 态 〈start state) (或 者 初始 状态 )， 期 望 的 状态 称 作 目标 状态 〈goal state )。 在 我 们 的 案例 中 ， 
一 个 状态 就 是 指 8 数码 游戏 的 一 个 布局 ， 开 始 状态 就 是 8 数码 游戏 提交 时 的 布局 ， 目标 状态 就 是 
图 11-1 所 示 的 已 经 解决 了 难题 的 布局 。) 

CC) 广 生 式 全 合 〈 又 称 规则 或 者 移动 )。 产 生 式 〈production) 是 指 能 在 应 用 环境 中 执 
行 的 一 个 操作 ， 并 使 系统 从 一 个 状态 转移 到 另 一 个 状态 。 每 个 产生 式 可 以 与 一 些 先 决 条 件 
相关 联 ， 也 就 是 说 ， 在 产生 式 被 应 用 之 前 ， 环境 中 必定 会 出 现 一 些 可 能 存在 的 条 件 。( 在 
我 们 的 案例 中 ， 产 生 式 就 是 方块 的 移动 。 一 个 方块 每 次 移动 的 前 提 条 件 是 其 相 邻 的 位 置 必 
须 有 空位 。) 

G) 控制 系统 。 控 制 系统 (control system) 是 由 解决 问题 使 其 从 开始 状态 变换 到 目标 状态 的 
志和 辑 组 成 的 。 在 处 理 过 程 的 每 一 步 ， 控 制 系统 都 要 决定 ， 在 满足 先决 条 件 的 那些 产生 式 中 ,下 
一 步 该 执行 哪 一 个 。〔〈 对 于 8 数码 游戏 的 例子 ， 给 定 一 个 特定 状态 ， 在 衬 位 旁 会 有 几 个 方块 ， 因 
而 人 存在 儿 个 可 用 的 产生 式 。 控 制 系统 必须 决定 移动 哪 一 个 方块 。) 

注意 ， 在 一 个 产生 式 系统 的 上 下 文中 ， 赋 予 解 决 8 数码 游戏 的 机 器 的 任务 可 以 被 程式 化 。 在 
这 种 情况 下 ， 控 制 系 统 采 用 程序 的 形式 。 蒋 杜 序 检查 8 数码 游戏 的 当前 状态 ， 确 定 导向 目标 状态 
的 一 系列 产生 式 ， 并 执行 这 一 系列 产生 式 。 因 此 ， 我 们 的 任务 就 是 为 解决 8 数码 游戏 设计 一 个 控 
制 系统 。 

控制 系统 开发 中 的 一 个 重要 概念 是 状态 图 〈state_ graph )， 它 是 一 种 方便 的 表示 或 至 少 概 念 
化 一 个 产生 式 系 统 中 的 所 有 状态 、 产 生 式 以 及 先决 条 件 的 方法 。 这 里 ，“ 图 ” 这 个 词 是 指 一 种 数 
学 家 称 为 有 向 图 〈directed graph) 的 结构 ， 是 指 一 组 由 箭头 连接 起 来 的 称 为 结 点 〈node) 的 位 
征 。 一 个 状态 图 由 一 组 用 箭头 连接 的 结 点 组 成 ， 结 点 表示 系统 中 的 状态 ， 入 头 表示 从 一 个 状态 
转换 到 另 一 个 状态 的 产生 式 。 状 态 图 中 两 个 结 点 被 一 个 箭头 连接 的 条 件 是 ; 当 且 仅 当 有 一 个 产 
生 式 ， 它 把 系统 从 箭头 起 点 处 的 状态 变换 到 箭头 终端 处 的 状态 。 

我 们 应 当 强 调 的 是 ， 正 像 在 解决 8 数码 游戏 时 拼图 可 能 状态 的 数量 使 我 们 难以 明确 地 提供 预 
先 网 制 好 的 解决 方案 一 样 ， 数 量 太 大 的 问题 也 使 得 我 们 不 能 明确 地 表示 整个 状态 图 ， 所 以 ， 状 
态 图 是 构思 解决 手头 问题 的 一 种 方法 ， 但 不 能 用 来 表示 全 部 内 容 。 虽 然 如 此 ， 你 会 发 现 ， 考 虑 
图 11-4 显 示 的 8 数码 游戏 的 一 小 部 分 状态 图 对 于 求解 难题 是 有 帮助 的 ， 

当 根 据 状态 图 来 考虑 时 ， 控制 系统 面临 的 问题 变 成 了 寻找 一 连 串 从 开始 状态 导向 目标 状态 
的 苞 头 。 毕 竟 ， 这 一 连 串 的 箭头 代表 了 解决 初始 问题 的 一 系列 产生 武 。 所 以 ， 不 管 应 用 是 什么 ， 
控制 系统 的 任务 都 可 以 看 作 是 寻找 一 条 贯穿 状态 图 的 路 径 。 对 控制 系统 的 这 种 普遍 观点 是 根据 
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产生 式 系统 对 要 求 推理 的 问题 进行 分 析 的 成 果 。 如 果 一 个 问题 能 够 根据 产生 式 系统 来 描绘 ， 那 
么 它 的 解决 方法 就 能 够 根据 搜索 一 条 路 径 来 明确 表达 。 





图 11-4 8 数码 久 戏 状态 图 的 一 小 部 分 


为 了 强调 这 一 点 ， 我 们 先 来 考虑 其 他 任务 是 如 何 按照 产生 式 系统 来 设计 ， 然 后 在 控制 系统 


通过 状态 图 发 现 路 径 的 背景 下 完成 的 。 人 工 智 能 的 经 典 问题 之 一 就 是 下 棋 这 样 的 沛 戏 ， 这 头 浙 


戏 在 一 个 明确 规定 的 背景 下 属于 中 等 复杂 度 ， 因 此 ， 它 为 理论 测试 提供 了 一 个 理想 的 环境 。 在 
下 棋 游 戏 中 ， 潜 在 产生 式 系统 的 状态 是 可 能 的 棋盘 布局 ， 产 生 式 是 棋子 的 移动 ， 控 制 系统 就 具 
体 为 棋 手 (人 或 别 的 )。 状 态 图 的 开始 结 点 表示 棋子 在 初始 位 置 时 的 棋盘 。 从 该 结 点 出 发 的 分 支 
是 一 些 箭头 ， 这 些 箭头 指向 游戏 中 在 棋子 的 第 一 步 移动 之 后 会 达到 的 那些 棋盘 布局 ， 而 从 这 些 
结 点 出 发 的 每 一 个 分 支 又 引 向 下 一 步 移 子 会 达到 的 那些 布局 ,依次 类 推 。 通过 这 种 明确 地 表达 ， 
我 们 可 以 把 一 个 下 棋 游戏 想象 为 有 两 个 选手 组 成 ， 每 个 选手 都 试图 通过 在 一 个 大 的 状态 图 中 寻 
找 一 条 通 向 自己 选择 的 目标 结 点 的 路 径 。 

或 许 从 给 定 事 实 得 出 还 辑 推论 的 问题 是 一 个 不 太 明 显 的 产生 式 系统 的 例子 。 在 这 种 情况 下 ， 
产生 式 是 称 为 推理 法 则 (inference rule) 的 逻辑 规则 ， 这 些 规则 允许 从 旧 命 题 中 形成 新 命题 。 例 
如 ， 命 题 “ 所 有 超级 英雄 都 是 崇高 的 ”和 “超人 是 超级 英雄 ”可 以 合并 产生 “超人 是 崇高 的 ” 
这 样 一 个 系统 中 的 状态 由 各 种 命题 组 成 ， 这 些 命题 在 推导 过 程 的 一 些 特定 点 为 真 : 开始 状态 是 
基本 命题 〈 常 称 为 公理 ) 的 集合 ， 从 中 可 以 得 出 结论 ， 而 目标 状态 则 是 包含 了 所 提出 结论 的 任 
何 命题 的 集合 。 

作为 一 个 例子 ， 图 11-5 显 示 了 以 下 推论 所 经 历 的 状态 图 的 一 部 分 。 从 一 组 命题 “ 苏 格 拉 底 
是 男人 兴 “ 所 有 男人 都 是 人 ”及 “所 有 人 都 终 有 一 死 ” 可 以 推论 出 “ 苏 格 拉 底 终 有 一 死 ” 从 中 
“我们 看 到 ， 随 着 推理 过 程 应 用 合适 的 产生 式 来 生成 新 的 命题 ， 知 识 的 主体 从 一 个 状态 转换 到 了 
另 一 个 状态 。 

当今 , 这 种 推理 系统 经 常 应 用 在 还 辑 程序 设计 语言 (6.7 节 ) 中 , 它 是 大 多 数 专 家 系统 (expert 
systems) 的 核心 。 专 家 系统 是 为 模拟 因果 推理 而 设计 的 软件 包 ， 这 些 因果 推理 是 人 类 的 专家 面 
对 相同 的 情形 所 遵从 的 。 例 如 ， 医 疗 专家 系统 用 来 协助 疾病 诊断 或 改良 治疗 。 
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开始 状态 





苏 格 拉 底 是 男人 
所 有 男人 都 是 人 
所 有 人 都 终 有 一 死 






苏 格 拉 底 是 男人 
所 有 男人 都 是 人 “上 => 苏 格 拉 底 是 人 









苏 格 拉 展 是 男人 
所 有 男人 都 是 人 
所 有 人 都 终 有 一 死 
苏 格 拉 底 是 人 


中 间 状 态 














苏 格 拉 底 是 男人 
所 有 男人 都 是 人 
所 有 人 都 终 有 一 死 
苏 格 拉 底 是 人 

苏 格 拉 底 终 有 一 死 


所 有 人 都 终 有 一 死 
苏 格 拉 底 是 人 上 上 => 苏 格 拉 底 终 有 一 死 






目标 状态 


灸 11-5 产生 式 系 统 环 境 中 的 演绎 推理 


生产 选 径 还 是 错误 引导 


一 种 在 现 论 的 发 展 和 测试 中 不 断 出 现 的 现象 是 ， 从 小 规模 实验 到 大 规模 应 用 的 转换 ， 一 
个 新 理论 的 最 初 实验 通常 涉及 一 些小 的 、 简 单 的 例子 。 一 旦 取得 成 功 ， 该 实验 环境 就 扩展 到 
受 现 实 的 、 大 规模 的 系统 。 一些 理 论 可 以 在 这 种 转换 中 生存 ， 有 些 则 不 能 。 有 时 小 规模 的 成 
切 足 以 鼓 兽 该 理论 的 支持 者 在 大 规模 中 的 失败 已 经 让 其 他 研究 人 员 灰心 之 后 坚持 不 懈 。 有 些 
情况 下 这 种 坚持 最 终 会 得 到 回报 ， 而 另 一 些 情 况 下 则 意味 着 白费 力气 

这 种 事情 在 人 工 智 能 领域 显而易见 。 有 一 个 例子 是 发 生 在 自然 语言 处 理 领域 的 ， 早 期 在 
有 限 集合 中 的 成 功 曾 使 很 多 人 相信 通用 自然 语言 理解 的 明光 即将 来 临 。 遗憾 的 是 ， 要 获得 大 
规模 应 用 的 进一步 成 功 已 经 被 证 实 极其 艰难 ， 付 出 巨大 却 成 效 缓慢 。 另 一 个 例子 是 人 工 神经 
网 络 学 科 , 该 学 科 刚 刚 兴 起 时 呼声 极 高 ,这 几 年 当 其 大 规模 应 用 能 力 受 到 质疑 时 则 呼声 渐 弱 ， 
现在 已 经 转 为 沉 才 。 正 如 文中 所 述 ， 人 工 智 能 领域 的 不 少 学 科 ， 还 有 广义 上 的 计算 机 科学 ， 
当前 都 面临 着 这 种 转换 的 考验 . 


11.3.2 ”搜索 树 


我 们 已 经 看 到 ， 在 产生 式 系统 的 环境 中 ， 控 制 系统 的 工作 涉及 搜索 状态 图 ， 找 出 从 开始 结 
所 到 目标 结 点 的 一 条 路 径 。 完 成 这 种 搜索 的 一 个 简单 的 方法 就 是 仔细 考察 每 一 个 从 初始 状态 发 
出 的 箭头 ， 并 记录 下 每 一 个 目标 状态 ， 然 后 继续 仔细 考察 从 这 些 新 状态 发 出 的 箭头 ， 再 记录 下 
结果 ， 依 次 类 推 。 对 目标 的 搜索 像 向 水 中 滴 入 一 滴 黑 水 一 样 ， 从 开始 状态 扩散 开 来 。 这 个 过 程 
继续 进行 ， 直 到 一 个 新 状态 就 是 目标 状态 ， 在 这 里 ， 解 决 方法 就 找到 了 ， 控 制 系统 只 需要 洛 着 
锌 发 现 的 这 条 从 开始 状态 到 目标 状态 的 路 径 应 用 产生 式 ， 

这 种 策略 的 结果 实际 上 是 建立 一 个 树 ， 称 作 搜索 树 〈search tree)， 它 由 被 控制 系统 分 析 后 
得 到 的 部 分 状态 图 构成 。 搜 索 树 的 根 结 点 是 开始 状态 ， 每 个 结 点 的 子 结 点 是 由 那些 应 用 一 个 产 
生 式 从 父 结 点 可 到 达 的 状态 构成 。 搜 索 树 中 结 点 间 的 每 条 弧 线 代表 一 个 产生 式 的 应 用 ， 从 根 到 


叶子 的 每 一 条 路 径 代表 状态 图 中 相应 状态 间 的 一 条 路 径 。 和 5 
解决 图 11-6 所 示 布 局 的 8 数码 游戏 将 会 产生 的 搜索 树 如 

图 11-7 所 示 。 该 搜索 树 最 左边 的 分 支 代表 试 图 通过 最 初 向 上 
移动 方块 6 来 解决 问题 ， 中 间 分 支 表 示 向 右 移动 方块 2 的 开 
局 方法 ， 而 最 右边 的 分 支 表示 以 向 下 移动 方块 5 来 开局 。 搜 
索 树 进一步 显示 ， 如 果 以 向 上 移动 方块 6 来 开局 ， 那 么 下 一 因 116 一 个 尚未 解 资 的 8 数码 游戏 
个 允许 的 产生 式 只 能 是 方块 8 右 移 。( 实 际 上 ， 这 时 还 可 以 将 方块 6 向 下 移动 ,但 这 仅仅 是 上 -个 
产生 式 的 倒置 ， 因 而 是 毫 无 关系 的 移动 。) 
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目标 
图 11-7 ”搜索 树 的 一 个 示例 


目标 状态 出 现在 图 11-7 显 示 的 搜索 树 的 最 下 面 一 层 。 因 为 这 预示 了 已 经 找到 了 一 个 解决 
方法 , 所 以 控制 系统 可 以 结束 搜索 过 程 并 开始 构建 指令 序列 , 该 指令 序列 将 用 来 解决 外 部 环 
境 中 的 拼图 难题 。 说 到 底 这 只 不 过 是 一 个 简单 的 过 程 : 从 目标 结 点 的 位 置 上 行 ， 同 时 在 遇 到 [520 
由 树 弧 线 表示 的 产生 式 时 将 它们 压 入 栈 。 这 种 技术 在 图 11-7 所 示 的 搜索 树 中 的 应 用 产生 了 如 
图 11-8 中 启示 的 产生 式 栈 。 现 在 ， 只 要 把 指令 从 该 栈 中 弹出 并 执行 ， 控 制 系统 就 能 够 解决 外 
界 的 问题 。 


栈 巴 一 一 方块 5 下 移 
方块 3 右 移 
方块 2 上 移 
方块 5 左 移 
方块 6 上 


图 11-8 压 入 栈 的 产生 式 以 备 后 用 521 


338 第 11 章 人 工 移 能 


还 有 一 点 我 们 应 当 注 意 ， 回 想 第 7 章 我 们 讨论 的 树 ， 利 用 一 个 指针 系统 来 指向 下 面 的 树 ， 由 
此 可 以 从 一 个 父 结 点 移动 到 它 的 子 结 点 。 但 是 在 搜索 树 的 情况 下 ， 控制 系统 必须 能 够 从 一 个 子 
结 点 移 到 其 父 结 点 ， 正 如 从 目标 状态 向 上 移 到 开始 状态 ， 构建 这 种 树 的 指针 系统 要 向 上 指 ， 而 
个 是 问 下 指 。 也 就 是 说 ， 每 个 子 结 点 包含 了 一 个 指向 其 父 结 点 的 指针 ， 而 不 是 父 结 点 和 包含 了 指 
向 其 子 结 点 的 指针 。( 有 些 应 用 中 这 两 组 指针 都 使 用 ， 允 许 在 树 中 双向 移动 。) 


11.3.3 司 发 


对 于 图 11-7 显 示 的 例子 ， 我 们 选择 一 个 开始 布局 ， 产 生 了 一 个 容易 处 理 的 搜索 树 。 但 是 在 
记 图 解决 一 个 比较 复杂 的 问题 时 ， 产 生 的 搜索 树 就 会 变 得 非常 庞大 。 在 国际 象棋 中 ， 第 一 步 就 
有 20 种 可 能 ， 因 此 在 这 样 的 情况 下 ， 搜 索 树 的 根 结 点 将 会 有 20 个 子 结 点 ， 而 不 是 我 们 例子 中 的 3 
个 。 而 且 ， 一 局 棋 易 手 30 至 35 次 是 常 有 的 情况 。 即 使 是 8 数码 游戏 ， 若 不 能 很 快 到 达 目 标 ， 搜 索 
例 也 会 变 得 非常 大 。 结 果 ， 开 发 一 个 完整 搜索 树 同 表示 出 全 部 状态 图 一 样 都 是 不 切实 际 的 。 

应 对 这 种 问题 的 一 种 策略 是 改变 搜索 树 构建 的 次 序 。 不 用 广度 优先 〈breadth_first) 的 方式 
(这 意味 着 树 是 一 层 一 层 地 构建 )， 我 们 可 以 沿 着 更 有 希望 的 路 径 往 深度 发 展 ， 只 有 在 原来 的 先 
择 不 会 导向 成 功 时 才 考虑 其 他 分 支 。 结 果 就 是 以 深度 优先 “〈depth-first) 的 方法 构建 搜索 树 ， 也 
山 是 说 ， 树 是 以 纵向 路 径 的 方式 构建 的 ， 而 不 是 以 横向 层次 的 方式 。 更 确切 地 说 ， 这 种 方法 通 
币 被 称 为 最 佳 优先 (best-firsb 结 构 ， 在 搜索 中 被 选中 的 垂直 路 径 是 看 起 来 能 提供 最 好 潜能 的 。 

最 佳 优先 的 方法 近似 于 人 类 面 对 8 数 码 游戏 时 应 用 的 策略 。 我 们 一 - 般 不 会 像 广度 优先 方法 那 
年 ， 同 时 沿 着 几 个 可 能 的 路 径 进行 。 相 反 ， 我 们 大 概 会 选择 看 起 来 最 有 希望 的 路 径 并 普 先 沿 着 
这 条 路 径 走 下 去 。 注 意 ， 我 们 说 的 是 “看 上 去 ”最 有 希望 的 。 在 一 个 特定 点 ， 我 们 很 难 确定 哪 
个 选择 一 定 最 佳 。 仅 仅 跟随 知觉 ， 当 然 可 能 误 入 歧途 。 但 不 管 怎样 ， 好 于 给 与 每 种 选择 同等 关 
注 的 亦 力 方法 ， 这 种 直觉 信息 似乎 给 了 人 类 一 个 优势 ， 所 以 在 自动 控制 系统 中 应 用 直觉 的 方法 
似乎 是 明智 的 。 

对 于 这 样 一 个 目标 来 说 , 我 们 需要 一 个 方法 来 鉴别 几 个 状态 中 哪 -一 个 看 上 去 是 最 有 希望 的 ， 
我 们 的 方法 是 采用 启发 〈heuristic)， 这 是 给 每 个 状态 赋予 的 -个 量化 值 ， 用 来 衡量 这 个 状态 与 
最 近 目 标 之 间 的 “距离 ”。 在 某 种 意义 上 ， 一 个 启发 值 是 衡量 规划 代价 的 - -个 尺度 。 给 定 两 个 状 
态 之 间 的 一 个 选择 ， 那 么 从 具有 较 小 启发 值 的 状态 到 达 目 标 ， 显 然 花 的 代价 小 。 因 此 ， 该 状态 
代表 了 应 遵循 的 方向 。 

一 个 局 发 值 应 具备 两 个 特征 。 第 一 ， 如 果 到 达 相 应 的 状态 ， 它 必须 包含 一 个 在 所 关联 的 状 
态 到 这 后 离 最 终 解 决 还 剩余 工作 量 的 合理 估计 。 这 意味 着 它 在 多 个 选项 中 做 出 选择 时 能 提供 有 
意义 的 信息 一 一 启发 提供 的 估计 越 精确 ， 根 据 此 信息 所 作 的 决定 就 越 正 确 。 第 二 ， 启 发 值 应 容 
匈 计 算 。 这 意味 着 它 的 利用 应 有 益 于 搜索 过 程 而 非 成 为 一 种 负担 。 如 果 计 算 启发 值 非常 复杂 ， 
那么 可 能 倒 不 如 把 时 间 花 费 在 推导 一 个 广度 优先 树 。 

在 8 数码 游戏 中 , 一 个 简单 的 启发 要 通过 计算 不 在 合适 位 置 上 的 方块 数目 来 估计 到 达 目 标的 
距 次 "一 一 这 种 推测 指 的 就 是 一 个 有 4 个 方块 不 在 合适 位 置 上 的 状态 ， 相 对 于 只 有 2 个 方块 不 在 
合适 位 置 上 的 状态 来 说 离 目 标 更 远 〈 也 就 因此 更 缺少 吸引 力 )。 然 而 ， 启 发 并 没有 考虑 方块 离 其 
人 世 置 有 多 远 。 假 如 这 两 个 方块 离 它们 相应 的 位 置 太 远 ， 就 需要 许多 产生 式 来 移动 它们 ， 

于 征 ， 有 一 个 比较 好 的 启发 是 测算 每 个 方块 离 其 终点 的 臣 离 ， 并 把 这 些 值 相 加 来 得 到 -一 个 
旺 。 一 个 直接 邻近 其 终点 的 方块 可 伴 有 距离 值 1， 而 一 个 角 与 其 终点 方块 相 接触 的 方块 可 伴 有 距 
离 值 2〈 因 为 它 至 少 要 在 垂直 方向 和 水 平方 向 各 移动 一 次 )。 这 种 启发 容易 计 筑 ， 并 对 拼图 从 最 
亡 状态 到 目的 状态 过 程 中 需要 移动 的 步 数 有 一 个 粗略 的 估计 。 例 如 ， 图 11-9 所 示 布 局 相应 的 户 
发 值 为 ?〈 因 为 方块 2、5 和 8 每 个 离 其 终点 的 距离 都 为 1， 和 而 方 其 3 和 6 每 个 离 终点 的 距离 都 为 2)。 
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实际 上 ， 它 的 确 需要 移动 7 步 来 完成 拼图 。 


__ ”这些 方 块 距 原始 
5 | 2 于 ”位置 至 少 移动 一 次 






W 
这 些 方块 距 原始 
位 置 至 少 移动 两 次 


图 11-9 ”一 个 未 解 的 8 数码 游戏 


既然 我 们 有 了 8 数码 游戏 的 一 个 启发 值 ， 下 一 步 就 把 它 结合 进 决 策 过 程 。 记 得 ， 一 个 人 在 做 [55 
决定 的 时 候 倾 向 于 选择 看 起 来 更 接近 目标 的 选项 。 所 以 我 们 的 搜索 过 程 应 当 考 虑 树 中 每 个 叶子 
结 点 的 启发 ， 并 且 从 启发 值 最 小 的 一 个 叶子 结 点 进行 搜索 。 这 就 是 图 11-10 所 采纳 的 搜索 策略 。 

图 11-10 中 给 出 了 开发 一 个 搜索 树 并 执行 得 到 的 解决 方法 的 算法 。 


创建 状态 图 的 开始 结 点 作为 搜索 树 的 根 结 点 ， 并 记 
录 它 的 局 发 值 

while 【目标 结 点 还 没有 到 达 ) do 

[选择 所 有 叶 结 点 中 有 最 小 启发 值 的 最 左边 叶 结 点 
将 这 个 选 定 的 结 点 作为 子 结 点 附加 到 通过 单个 


产生 式 能 到 达 的 结 点 
在 搜索 树 中 结 点 的 旁边 记录 每 一 个 新 结 点 的 启发 
值 ] 
从 目标 结 点 向 上 遍历 搜索 树 ， 把 与 每 个 经 过 的 相 
关联 的 产生 式 压 入 术 
通过 执行 从 栈 中 弹出 的 产生 式 解 决 原始 问题 





图 11-10 采用 局 发 的 控制 系统 的 一 个 算法 


让 我 们 把 这 个 算法 应 用 到 8 数码 游戏 ， 从 图 11-6 给 出 的 初始 布局 开始 。 首 先 ， 我 们 建立 初始 
状态 并 将 它 作 为 根 结 点 ， 记 录 下 它 的 启发 值 是 s。 然 后 ， 如 图 11-11 所 示 ，while 循 环 体 的 第 一 次 
循环 添加 了 3 个 从 初始 状态 能 达到 的 结 点 。 注意 , 我 们 已 经 在 结 点 下 的 括号 里 记录 了 每 一 个 叶子 
结 点 的 启发 值 。 





图 11-11 启发 的 开始 52 
目标 还 没有 达到 ， 所 以 我 们 再 次 执行 while 循 环 体 ， 这 次 是 从 最 左边 的 结 点 扩展 搜索 (“ 有 


发 
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最 小 启发 值 的 最 左边 叶子 结 点 。 结 果 搜 索 树 呈 图 11-12 所 示 的 形式 。 
现在 ， 最 左边 叶子 结 点 的 启发 值 是 s， 说 明 这 个 分 支 也 许 根 本 不 是 一 个 好 选择 。 算 法 注意 到 
这 一 点 ， 在 下 一 次 经 过 时 ， 循 环 指示 从 最 右边 结 点 扩展 〈 它 现在 是 “有 最 小 启发 值 的 最 左边 时 
和子 结 点 思 。 这 样 扩 展 后 的 搜索 树 如 图 11-13 所 示 。 





图 11-12 两 次 搜索 后 的 搜索 树 图 11-13 三 次 搜索 后 的 搜索 树 


这 时 ， 算 法 好 像 走 上 正轨 。 因 为 最 右边 结 点 的 启发 值 只 是 3，while 语 名 指示 继续 沿 着 这 条 
路 径 进行 ， 搜 索 直 瞄 目 标 ， 产 生 了 如 图 11-14 所 示 的 搜索 树 。 这 个 树 同 图 11-7 所 示 的 搜索 树 相 比 
较 表 明 ， 新 算法 即使 早期 走 了 点 弯路 ， 但 启发 信息 的 利用 已 经 大 大 减少 了 搜索 树 的 大 小 ， 并 且 
处 理 效率 大 大 增加 。 





135 

】 是 妆 

人 5) 3 
135 135 13 

(4 上 26 (Bi 上 了 何方 425 
号 786 786 
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(| 站 富 (人 425 
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图 11-14 用 月 发 系统 形成 的 完整 搜索 树 
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在 到 过 目标 状态 之 后 ，while 语 句 终止 ， 我 们 从 目标 结 点 反 向 向 上 移动 到 根 结 点 ， 沿 途 把 遇 


ee 
， 当 这 些 产生 式 从 栈 中 弹出 时 ， 我 们 就 被 指示 执行 它们 。 这 时 ， 我 们 可 以 看 到 解决 拼 


fn 的 指标， 开始 移 动 方志 5 





We 但 是 ， 今天 许多 人 认为 ， 
人 类 的 智能 并 非 基 于 复杂 程序 的 执行 ， 而 是 经 历 了 世代 进化 而 来 的 简单 的 刺激 一 反应 功能 . 
这 种 关于 “智能 ”的 理论 称 为 基于 行为 的 暂 能 ， 因 为 “智能 的 ” 刺激 一 反应 功能 似乎 是 一 些 
行为 的 结果 ， 这 些 行为 导致 某 些 个 体 在 其 他 个 体 遭 难 时 得 以 幸免 且 敬 殖 ， 

基于 行为 的 智能 似乎 能 回答 人 工 智 能 范畴 的 若干 问题 ， 例 如 ， 为 什么 基于 汉 ， 诺 依 里 体 
系 结构 的 机 器 在 计算 能 力 上 能 轻易 地 胜 过 人 类 ， 却 难以 展现 常识 性 的 判断 力 。 因 此 ， 基 于 行 
为 的 智能 有 希望 成 为 人 工 物 能 研究 中 的 一 个 重要 的 影响 因素 。 正 如 文中 描述 的 那样 ， 基 于 行 
为 的 技术 已 经 应 用 在 人 工 神 经 网 络 领域 ， 训 练 神 经 元 如 何 按 所 期 望 的 方式 表现 ; 应 用 在 遗传 
算法 领域 ， 为 更 传统 的 编程 过 程 提供 一 个 可 殿 选 择 的 方法 : 应 用 在 机 串 人 学 领域 ， 通 过 反应 
策略 来 改进 机 器 的 性 能 ， 


问题 与 练习 


1 产生 式 系统 在 人 工 智能 中 有 什么 重要 意义 ? 
2 画 出 8 数码 游戏 中 ， 围 绕 着 代表 下 图 状态 的 结 点 的 那 部 分 状态 图 : 


由 





4 用 笔 纸 以 及 广度 优先 方法 , 构建 出 以 下 图 为 开始 状态 解决 8 数码 游戏 时 所 产生 的 搜索 树 ( 不 必 做 完 ) 
你 会 碰 到 什么 问题 ? 





' 总 山 者 为 到 达 项 峰 ， 只 考虑 当地 地 形 ， 并 总 是 沿 着 最 陡峭 的 上 坡 行进 ， 解 决 8 数码 游戏 的 启发 式 芭 统 
与 登山 者 之 间 有 什么 相似 之 处 ? 
. 利用 本 节 所 讲 的 启发 式 方法 ， 采 用 图 11-10 所 示 的 控制 系统 算法 ， 解决 下 面 给 出 的 8 数码 游戏 : 


Cn 


局 n 





人 | 
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7. 改进 我 们 计算 8 数码 问题 中 一 个 状态 的 局 发 值 的 方法 ， 使 图 11-10 所 示 的 搜索 算法 不 会 做 出 错误 的 选 
择 ， 苹 像 在 本 节 中 的 例子 中 那样 。 你 能 否 举 出 一 个 例子 ， 改 进 的 启发 仍然 会 导致 搜索 走 入 野 途 ? 


站 TFT 9 让 
让 


11.4 ”其 他 研究 领域 


一 一 一 -一 一 一 一 一】 一 - -一 


本 方 ， 我 们 来 探 客人 工 智能 领域 一 直 挑战 研究 人 员 的 另外 两 个 主题 : 知识 处 理 和 学 习 。 这 
两 个 主题 涉及 的 能 力 对 人 类 大 脑 来 说 看 上 去 很 简单 , 但 是 对 机 器 的 能 力 来 说 却 负担 沉重 。 目 前 ， 
本 质 上 通过 避免 百 接 面 对 这 些 问 题 (或 许 通 过 应 用 聪明 捷径 或 限制 问题 出 现 的 范围 ) 在 开发 * 智 
能 ” 体 方面 已 经 取得 了 很 大 的 进展 。 


11.4.1 知识 的 表达 和 处 理 


在 关于 感知 的 讨论 中 ， 理 解 图 像 需 要 大 量 的 关于 图 像 细 节 的 知识 ， 理 解 一 句 话 的 意思 可 能 
要 依赖 其 所 处 的 上 下 文 。 这 些 都 是 知识 仓库 起 作用 的 例子 ， 这 些 称 为 真实 世界 知识 〈real-world 
knowledge)， 筷 们 是 由 人 脑 维护 的 。 人 类 以 某 种 方式 存储 大 量 的 信息 并 且 以 非凡 的 效率 从 信息 
中 汲取 有 用 的 信息 。 赋 予 机 器 这 种 能 力 是 人 工 智能 面临 的 一 个 重要 挑战 。 

潜在 的 目标 是 找到 表示 和 存储 知识 的 途径 。 这 是 很 复杂 的 ， 就 像 我 们 已 经 看 到 的 事实 那样 ， 
知识 以 陈述 性 和 过 程 性 这 两 种 形式 出 现 。 因 此 ， 知 识 表 示 不 仅 是 事实 的 表示 ， 而 是 包含 了 一 个 
更 广泛 的 领域 。 因 此 ， 能 和 否 最 终 找 到 一 种 用 来 表示 所 有 形式 的 知识 的 单一 方案 是 值得 怀疑 的 。 

然而 ， 问 题 不 仅仅 是 表示 和 存储 知识 。 知 识 也 必须 是 容易 理解 的 ， 并 且 获 取 这 种 理解 是 一 
小 挑战 。11.2 节 介绍 的 语义 网 通常 用 来 作为 知识 表示 和 存储 的 一 种 手段 ， 但 是 ， 从 中 提取 信息 
可 能 是 有 问题 的 。 例 如 ， 句 子 “Mary hit John ”的 意思 依赖 于 Mary 和 John 的 相对 年 龄 〈 是 2 岁 和 
30 岁 或 是 相反 ? )。 这 种 信息 可 能 被 存储 在 图 11-3 给 出 的 完整 的 语义 网 中 ， 但 是 在 上 下 文 分 析 的 
过 程 中 ， 提 取 这 样 的 信息 需要 对 语义 网 进行 大 量 的 搜索 。 

处 理 知 识 仓 取 还 有 另外 一 个 问题 是 ， 知 识 的 鉴别 不 是 明确 的 ， 而 是 含 蔷 的 ， 是 与 手头 的 工 
作 相 联系 的 。 相 对 于 直接 用 一 个 “没有 ”来 回答 问题 “ 亚 琴 赢 了 比赛 吗 ? ” 我 们 想 要 一 个 系统 
可 以 这 样 回 答 :“ 没 有 ， 他 因为 流感 病 倒 了 ， 没 有 完成 比赛 。.” 下 一 节 我 们 将 探究 联想 记忆 的 概 
念 ， 这 是 试图 解决 有 关系 信息 问题 的 一 个 研究 领域 。 然 而 ， 任 务 不 仅仅 是 找到 有 关系 的 信息 ， 
我 们 需要 系统 能 够 区 分 有 关系 的 信息 和 相关 联 的 信息 。 例 如 ,“ 不 ， 他 是 一 月 份 出 生 ， 他 妹妹 的 
名 字 叫 利 耳 。” 这 样 的 回答 就 不 会 被 认为 是 对 于 前 面 问题 的 一 个 有 意义 的 回答 , 即使 该 信息 是 通 
过 某 些 相关 的 方式 提交 。 

开发 更 好 的 知识 提取 系统 的 另 一 个 方法 是 向 提取 过 程 插入 各 种 各 样 的 推理 ， 结 果 产 生 了 称 
为 元 推理 《meta-reasoning) 的 方法 ， 即 关于 推理 的 推理 。 举 一 个 例子 ， 数 据 库 搜 索 最 初 是 应 用 
封 团 世界 假设 (closed-world assumption)。 这 种 假设 是 一 个 句子 为 假 ， 除非 它 能 够 可 能 从 可 用 的 
信息 中 明确 得 出 。 例 如 ， 封闭 世界 假设 允许 数据 库 做 出 Nicole Smith 没 有 订阅 特定 的 杂志 这 样 的 
推断 ， 即 使 数据 库 中 没有 包含 任何 关于 Nicole 的 信息 。 处 理 过 程 就 是 观察 Nicole Smith 不 在 订阅 
列表 中 ， 然 后 应 用 封闭 世界 假设 推断 Nicole Smith 没 有 订阅 。 

封 团 世界 假设 在 表面 上 看 起 来 微不足道 ， 但 是 结果 证 明 ， 人 不 


合 需要 的 作用 。 例 如 ， 假 定 我 们 仅 有 的 知识 是 一 句 话 。 


Mickey 15 a mouse O 〇 R Donald ; is a duck. 
抓 立 地 看 这 个 句子 ， 我 们 不 能 推断 出 Mickey 实 际 上 是 一 只 老鼠 。 因 此 ， 封 闭 世 界 假设 强制 断定 
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句子 

Mickey is a mouse. 
为 假 。 以 相同 的 方式 ， 封 闭 世 界 假设 强制 断定 句子 

Donald ls a duck， 
为 假 。 这 样 ， 尽 管 两 个 句子 中 至 少 有 一 个 为 真 ， 封 闭 世 界 假设 已 经 引导 我 们 得 出 了 相 矛 盾 的 结 
论 : 两 个 句子 都 为 假 。 理 解 这 种 元 推理 技术 是 人 工 智 能 和 数据 库 这 两 个 领域 研究 的 一 个 目标 ， 
同时 也 强调 了 涉及 智能 系统 开发 的 复杂 性 。 

最 后 ， 有 一 个 问题 称 为 框架 问题 〈frame problem)， 用 来 在 变化 的 环境 中 使 存储 的 知识 保持 
地 新 。 如 采 一 个 智能 体 打 算 使 用 它 的 知识 来 决定 其 行为 ， 那 么 ， 该 知识 必须 是 当前 的 。 但 是 ， 
支持 智能 行为 所 需 知识 的 数量 是 庞大 的 ， 在 变化 的 环境 中 维护 这 些 知 识 是 一 项 繁重 的 工作 。 一 
个 复杂 的 因素 是 ， 在 一 个 环境 中 发 生 的 改变 经 常会 间接 地 改变 信息 中 的 其 他 细节 ， 而 且说 明 这 
种 间接 影响 的 结果 是 很 困难 的 。 例 如 ， 如 果 一 个 花瓶 被 敲 碎 了 ， 尽 管 水 酒 了 是 打 碎 花瓶 的 唯一 
间接 绪 果 ， 但 对 于 这 种 状况 ， 你 的 知识 不 会 再 包括 水 在 花瓶 中 这 样 的 事实 。 因 此 ， 解 决 框架 问 
题 不 仅 需要 以 一 种 有 效 的 方式 存储 和 获取 大 量 信息 的 能 力 ， 而 且 要 求 存储 系统 能 够 正确 地 反应 
间接 的 推论 。 


11.4.2 “学习 


除了 和 表 示 和 处 理 知 识 ， 我 们 还 希望 赋予 智能 体 获取 知识 的 能 力 。 我 们 可 以 通过 编写 和 安装 


一 个 新 程序 或 者 直接 向 数据 库 中 添加 数据 来 “ 教 ” 基 于 计算 机 的 智能 体 ， 但 是 我 们 更 希望 智能 
体能 够 目 己 学 习 。 我 们 希望 智能 体能 够 适应 环境 的 变化 并 执行 任务 ， 这 些 任务 并 不 是 通过 事先 
疝 单 地 编写 程序 就 能 够 完成 的 。 一 个 为 做 家 务 而 设计 的 机 器 人 将 面 对 新 家 具 、 新 设备 、 新 宠物 
其 至 是 新 主人 ， 一 辆 能 自己 驾驶 的 轿车 必须 能 适应 道路 交通 线 的 变化 ;博弈 智能 体 应 当 能 够 开 
发 和 应 用 新 的 策略 。 

一 种 把 计算 机 学 习 的 途径 进行 归 类 的 方法 是 根据 需要 人 类 干涉 的 程度 。 学 习 的 第 一 层 
是 模仿 (imitation)， 人 类 直接 演示 一 个 任务 的 步骤 《可 能 是 通过 执行 一 系列 的 计算 机 操作 
或 是 通过 一 系列 动作 将 机 器 人 移动 )， 而 计算 机 仅仅 是 记录 这 些 步骤 。 这 种 形式 的 学 习 应 
用 在 像 电子 表格 和 字 处 理 软件 这 样 的 应 用 程序 中 已 经 很 多 年 了 ， 在 这 些 应 用 软件 中 ， 记录 
频繁 发 生 的 指令 序列 ， 然 后 通过 一 个 请 求 就 可 以 重 放 。 注 意 ， 通 过 模仿 学 习 智 能 体 承 担 的 
任务 很 少 。 

学 习 的 下 一 个 层次 是 通过 监督 学 习 〈supervised training)。 在 监督 学 习 过 程 中 ， 人 对 一 连 串 
的 示例 确定 正确 的 反应 ， 然 后 智能 体 对 这 些 示例 进 行 归纳 ， 开 发 出 一 种 适用 于 新 案例 的 算法 。 
这 一 连 串 的 示例 称 为 训练 集 〈training set)。 监 督学 习 的 典型 应 用 包括 学 习 识 别 一 个 人 的 笔迹 或 
声音 ， 学 习 区 分 垃圾 邮件 和 受 欢迎 的 邮件 ， 以 及 学 习 如 何 从 一 组 症状 中 验 明 疾病 。 

学 习 的 第 3 个 层次 是 强化 学 习 (reinforcement)。 在 强化 学 习 过 程 中 ， 给 予 智 能 体 一 个 一 般 规 
则 ， 通 过 反复 试验 ， 使 其 在 工作 中 当成 功 或 失败 时 能 自我 判定 。 当 胜 负 容 易 分 辨 时 ， 强 化 学 习 
对 于 学 习 如 何 玩 国际 象棋 或 跳棋 这 样 的 游戏 是 很 有 益 的 。 相 对 于 监督 学 习 ， 当 智能 体 学 习 改 善 
其 行为 时 ， 强 化 学 习 允 许 智 能 体 独 立行 动 。 

因为 还 没有 发 现 覆 盖 所 有 可 能 的 学 习 行为 的 通用 的 学 习 规则 ， 所 以 学 习 -- 直 是 一 个 有 挑战 
性 的 研究 领域 。 然而 , 有 很 多 研究 进展 的 例子 。 其 中 一 个 就 是 在 卡 内 基 - 梅 隆 大 学 开发 的 ALVINN 
《基于 神经 网 络 的 自动 驾驶 车 辆 ) 系统 ， 该 系统 学 习 如 何 驾驶 一 辆 配 有 一 台 车 载 电脑 的 大 篷车 ， 
车 载 电脑 使 用 一 台 摄像 机 作为 输入 。 这 里 所 采用 的 方法 就 是 监督 学 习 。ALVINN 从 人 类 驾驶 员 


| 
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那里 搜集 数据 并 且 利用 这 些 数据 调整 自己 的 驾驶 决策 。 像 它 所 学 习 的 ， 该 系统 可 以 预测 向 哪里 
芍 驶 ， 对 照 人 类 驾驶 员 的 数据 来 检查 自己 的 预测 ， 然 后 修改 自己 的 参数 使 其 更 接近 人 类 的 驾驶 
选择 。ALVINN 获 得 了 很 大 的 成 功 ， 它 能 够 以 每 小 时 55 英 里 的 速度 驾驶 大 篷车 ， 同 时 引发 了 其 
他 方面 的 研究 ， 已 经 产生 了 可 以 成 功 在 道路 上 轰 驶 的 控制 系统 。 

与 开发 单一 智能 体 的 学 习 技术 相对 应 ， 另 外 一 种 对 学 习 进 行 研 究 的 方向 是 开发 一 种 智能 体 
的 后 代 能 够 通过 一 个 进化 过 程 来 学 习 的 技术 。 这 个 领域 称 为 遗传 算法 《genetic algorithms)， 它 
探索 如 何 把 目 然 进化 理论 用 在 智能 体 的 开发 上 ， 其 目标 是 通过 应 用 “ 适 者 生存 ”法 则 设计 问题 
的 解决 方法 。 建 立 和 评估 一 组 被 提议 的 解决 方案 ， 然 后 选择 和 混合 最 好 的 方案 ， 满 怀 希望 地 创 
造 相 对 于 原始 集合 具有 改进 的 新 一 代 解 决 方法 。 通 过 一 遍 一 遍地 重复 该 过 程 ， 目 标 是 进化 得 到 
越 来 越 好 的 解决 方案 ， 直 到 “学 习 ” 到 一 个 成 功 的 解决 方案 。 


导 辑 程序 设计 知识 

在 知识 圾 示 和 存储 中 一 个 很 重要 的 关注 点 就 是 采用 何 种 方式 与 系统 相 匹 配 并 使 得 系统 
能 够 存 取 知识 。 在 这 种 背景 下 ， 还 辑 程序 设计 ( 见 6.7 节 ) 经 常 证 明 是 有 利 的 。 在 这 样 的 系统 
中 ， 知 识 用 

Dumbo ls an elephant. 
和 

AISanelephant implies 其 褒 gray. 
这 样 的 “ 怕 辑 ”语句 来 表达 。 这样 的 语句 能 够 用 符号 系统 来 表达 ， 这 对 于 推理 规则 的 应 用 是 
钨 于 实现 的 。 正 如 在 图 11-5 所 见 的 演绎 推理 序列 就 可 以 采用 直接 的 方式 实现 。 因 而 在 远 辑 程 
序 设 计 中 ， 知 识 的 表达 和 存储 与 知识 的 提取 和 应 用 过 程 很 好 地 整合 在 一 起 。 可 以 说 ， 届 辑 程 
序 设计 系统 为 知识 的 存储 和 应 用 之 间 提 供 了 一 个 “无 终 ” 边 办 


把 遗传 算法 应 用 到 程序 开发 工作 中 的 方法 称 为 进化 程序 设计 (evolutionary programming )。 
这 里 ， 目 标 是 通过 允许 程序 进化 而 不 是 直接 编写 程序 来 开发 程序 。 研究 人 员 已 经 使 用 函数 编 
程 语 言 把 进化 规则 技术 应 用 到 程序 开发 过 程 中 。 这 种 方法 以 包含 多 种 函数 的 一 组 程序 开始 ， 
这 个 开始 集合 里 的 函数 构成 一 个 “基因 池 ?” 程序 后 代 就 是 从 这 个 基因 池 构 建 而 来 的 。 然 后 ， 
布 于 通过 上 一 代 中 最 好 的 执行 者 所 产生 的 后 代 经 过 很 多 代 的 进化 最 终 得 到 目标 问题 的 解决 
办 法 。 

最 后 ， 我 们 应 该 认识 一 个 与 学 习 紧 密 相 关 的 一 个 现象 ， 发 现 。 其 区 别 是 ， 学 习 是 “基于 目 
标的 ”而 发 现 不 是 。 名 词 “ 发 现 ” 含 有 意料 之 外 的 意思 ， 不 是 现 有 的 可 以 学 习 的 。 我 们 可 以 着 
手 去 学 习 一 门 外 语 或 如 何 驾驶 轿车 ， 但 是 我 们 可 能 发 现 那 些 任务 比 我 们 想 银 得 更 加 困难 。 一 个 
探索 者 可 能 会 发 现 一 个 大 的 湖 ， 而 目标 仅仅 是 学 习 那 儿 有 什么 。 

开 上 具有 有 效 发 现 能 力 的 智能 体 需 要 该 智能 体能 够 识别 潜在 的 富有 成 效 的 “思考 训练 ”% 这 
里 ， 发 现在 很 大 程度 上 依赖 推理 的 能 力 以 及 启发 的 使 用 。 此 外 ， 许 多 发 现 的 潜在 应 用 需要 智能 
体能 够 区 别 有 意 义 的 结果 和 无 意义 的 结果 。 例 如 ， 一 个 数据 挖掘 智能 体 不 应 当 报 告 所 发 现 的 每 
一 个 微不足道 的 关系 。 

计算 机 发 现 系统 中 成 功 的 例子 包括 以 哲学 家 弗朗西斯 .培根 田 士 命名 的 Bacon, 它 已 经 能 发 
现 《 或 许 应 该 说 是 “重新 发 现 汪 电工 学 上 的 欧姆 定律 ,行星 运行 的 开 普 勒 第 三 定律 以 及 动量 守 
便 怕 理 。 系 统 AUTOCLASS 更 有 说 服 力 ， 它 采用 红外 光谱 数据 ， 已 经 发 现 了 目前 在 天 文学 上 未 
知 的 新 型 的 恒星 一 一 计算 机 完成 的 一 个 真实 的 科学 发 现 。 
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问题 与 练习 

1. 名 词 “ 真 实 世 界 知 识 ” 是 什么 意思 ? 它 在 人 工 智能 领域 有 何 重要 意义 ? 

2 一 个 关于 杂志 订阅 者 信息 的 数据 库 通 常 包含 一 个 关于 每 一 种 杂志 订阅 者 的 列表 , 但 是 不 包含 没有 订阅 
的 人 的 列表 。 那 么 ， 这 种 数据 库 如 何 确定 一 个 人 没有 订阅 一 种 特定 的 杂志 ? 

3. 概述 框架 问题 。 

4 给 出 训练 一 台 计 算 机 的 三 种 途径 ， 哪 一 种 没有 涉及 直接 的 人 为 十 预 ? 

5. 进化 技术 如 何 区 别 于 更 传统 的 计算 机 学 习 技 术 ? 


伴随 着 人 工 智 能 所 取得 的 所 有 进展 ， 这 个 领域 里 的 许多 问题 仍然 使 得 基于 汉 “. 诺 依 曼 体 系 
的 计算 机 的 能 力 备 受 重负 。 执 行 指令 序列 的 中 央 处 理 单元 的 感知 和 推理 能 力 看 来 不 能 与 人 的 大 
脑 相 匹敌 。 由 于 这 个 原因 ， 许 多 研究 者 的 目标 转向 了 其 他 体系 结构 的 机 器 。 其 中 之 一 就 是 人 工 
神经 网 络 。 


11.5.1 基本 特性 


如 第 2 章 介 绍 的 那样 , 人 工 神 经 网 络 由 许多 单个 的 处 理 器 以 模仿 活 的 生物 体 神 经 元 网 络 的 方 
式 构成 ， 这 些 处 理 器 称 为 处 理 单 元 (processing unit)。 一 修 生 物 神 经 元 是 一 单个 细胞 ， 具 有 一 些 
称 为 树 突 的 输入 触角 和 一 个 称 作 轴 突 的 输出 触角 〈 图 11-15)。 经 由 一 个 细胞 的 轴 突 传递 的 信和 号 
反映 了 细胞 是 处 于 抑制 状态 还 是 兴奋 状态 .这 种 状态 由 细胞 的 树 突 接收 到 的 信号 的 合成 来 决定 。 
这 些 树 突 从 其 他 细胞 的 轴 突 通过 称 为 突 触 的 小 间 耻 采 集 信 号 。 研 究 表明 ， 一 个 突 触 的 传导 性 是 
由 突 触 的 化 学 成 分 控制 的 。 也 就 是 说 ， 具体 的 输入 信和 号 将 对 神经 元 起 兴奋 作用 还 是 抑制 作用 是 
由 突 扔 的 化 学 成 分 决定 。 所 以 可 以 认为 ， 一 个 生物 神经 网 络 是 通过 调整 神经 元 间 的 这 些 化 学 连 
接 来 学 习 的 。 


来 目 其 他 神 


败 元 [的 轴 罕 
侍 尝 








:天 解 


图 11-15 活 的 生物 体 中 的 一 个 神经 元 


人 工 神经 网 络 的 一 个 处 理 单元 是 模仿 对 生物 神经 元 这 种 基本 了 解 的 一 个 简单 装置 。 根 据 其 
有 效 输入 是 否 超过 了 一 个 给 定 的 值 〈 这 个 值 称 为 处 理 单元 的 益 值 (threshold valuey) 产生 0 或 1 
作为 输出 。 如 图 11-16 所 示 ， 这 个 有 效 输入 是 许多 实际 输入 的 一 个 加 权 和 。 图 中 ，3 个 处 理 单元 
《 记 为 mw、m 和 mm) 的 输出 用 作 另 一 个 处 理 单元 的 输入 。 第 4 个 单元 的 这 些 输入 与 称 为 权 (weight) 
的 一 些 值 《 记 为 wi、wz 和 ws) 相关 联 。 接 收 单元 把 每 个 输入 值 与 相应 的 权 值 相 乘 ， 再 把 这 些 乘 
积 相 加 形成 有 效 输入 〈vwnwi+vawz+waw3)。 如 果 这 个 和 超过 该 单元 的 阁 值 ， 那 么 该 单元 就 产生 一 
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个 输出 值 1〈 模 拟 神经 元 的 兴奋 状态 );， 否则 就 产生 一 个 输出 值 0〈 模 拟 神经 元 的 抑制 状态 )。 

按照 图 11-16， 我 们 采用 和 拖 形 作为 表示 处 理 单 元 的 约定 符号 ， 在 单元 的 输入 端 为 每 个 输入 放 
置 一 个 较 小 的 矩形 ， 并 在 矩形 内 写 上 与 这 个 输入 相关 联 的 权 值 ， 最 后 在 大 矩形 中 央 写 上 这 个 单 
元 的 国 值 .图 11-17 的 例子 表示 了 一 个 有 3 个 输入 且 阔 值 为 1.5 的 处 理 单元 。 第 1 个 输入 的 权 值 为 -2， 
第 2 个 输入 的 权 值 为 3， 第 3 个 输入 的 权 值 为 -1。 因 此 ， 如 果 单 元 接收 的 输入 分 别 为 1、1、0， 那 
么 其 有 效 和 输入 为 (D(-2)+(1)(G3)+HO)(-1D)=1， 所 以 其 输出 为 0。 但 是 ,如果 单元 接收 的 输入 分 别 为 0、 
1、1， 那 么 其 有 效 输入 为 (0)(-2)+(1)(3)+(DC-D=2， 超 出 了 阐 值 ， 所 以 单元 的 输出 为 1。 


Vj 
上 


| 
计算 有 效 输 入 : 1 ”将 有 效 输入 与 
VIPWT+VY2Wa+v3aw3 | ， 闪 值 进行 比较 
| 










产生 输出 0 或 ! 





图 11-16 一 个 处 理 单元 中 的 活动 


11-17 一 个 处 理 单元 的 表示 


权 值 可 以 是 正 值 ， 也 可 以 是 负 值 ， 说 明 相 应 的 输入 对 接收 单元 的 作用 可 以 是 兴奋 或 是 抑制 。 
《者 权 值 为 负 ， 接 收 的 输入 为 1 就 减少 了 加 权 和 ， 故 有 效 输入 偏向 低 于 赣 值 ， 相 反 ， 一 个 正 的 权 
值 使 相应 输入 对 加 权 和 起 增加 作用 ， 故 增加 了 加 权 和 超过 阅 值 的 机 会 .) 此 外 ， 权 的 实际 大 小 控 
制 了 相应 输入 单元 对 接收 单元 起 抑制 作用 还 是 兴奋 作用 的 程度 。 因 此 ， 通 过 调节 整个 人 工 神 经 
网 络 中 的 权 值 ， 就 能 够 对 网 络 编程 ， 以 预定 的 方式 对 不 同 的 输入 做 出 响应 。 

图 11-18 给 出 了 一 个 简单 的 神经 网 络 的 例子 。 图 11-18a 编 程 为 : 若 两 个 输入 不 同 ， 则 产生 输 
出 1 否则 输出 0。 但 如 果 改 变 权 值 如 图 11-18b 所 示 ， 那 么 这 个 网 络 无 论 其 两 个 输入 都 是 1， 或 者 
有 一 个 是 0， 其 响应 都 是 1。 

我 们 应 当 注 意 ， 图 11-18 所 示 的 网 络 比 实际 的 生物 神经 网 络 实在 是 太 过 于 简单 。 一 个 人 的 大 
脑 大 约 包含 10 个 神经 元 ， 每 个 神经 元 约 有 104 个 突 触 。 事 实 上 ， 一 个 生物 神经 元 的 树 突 多 得 更 
像 一 个 纤维 网 ， 而 不 像 图 11-15 中 所 表示 的 一 个 个 触角 。 


11.5.2 训练 人 工 神经 网 络 


人 工 神经 网 络 的 一 个 重要 特征 是 其 不 是 传统 意义 上 的 被 编程 而 是 被 训练 。 也 就 是 说 ， 一 个 
程序 员 不 再 决定 解决 一 个 特定 问题 所 需 权 的 值 ， 然 后 并 把 这 些 值 “ 插 ” 入 网 络 中 ， 相 反 ， 一 个 
人 人 工 神经 网 络 通过 监督 训练 学 习 获 得 合适 的 权 值 (11.4 节 )， 该 训练 是 一 个 反复 的 过 程 ， 从 训练 
装置 而 来 的 输入 被 应 用 到 网 络 ， 然 后 用 小 的 增 量 调整 权 值 使 网 络 的 性 能 接近 期 望 状态 。 如 何 调 
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整 权 值 是 一 个 值得 研究 的 课题 。 修 改 权 值 需要 的 一 种 策略 是 ， 每 个 新 的 调整 都 导向 总 目标 而 不 
是 破坏 前 一 步调 整 取得 的 进展 。 


Ra 
贡 半 一 四 ”六 


o 
一 一 一 有 


(b) 
岛 11-18 有 两 个 不同 程序 的 神经 网 络 


为 了 说 明 这 个 问题 ， 考 虑 培训 如 图 11-19 所 示 网 络 〈 其 中 所 有 权 的 值 设 为 0) 当 其 输入 不 同 
时 正确 地 产生 一 个 输出 1 的 任务 。 也 就 是 说 ， 我 们 想 要 输入 模式 1.0 和 0,1 产 生 输 出 1， 而 输入 模式 
0.0 和 1,1 产 生 输 出 0。 (在 图 11-18a 中 ， 我 们 已 经 看 到 了 对 于 这 个 问题 的 解决 方法 。) 我 们 给 两 个 输 
入 者 赋值 1 来 开始 这 个 训练 过 程 。 如 图 11-20a 所 示 ， 我 们 观察 到 输出 是 期 望 的 0， 于 是 不 管 这 个 网 
络 ， 符 试 输入 模式 10〈 如 图 11-20b)， 继 续 训 练 过 程 。 这 次 产生 了 输出 0， 而 我 们 希望 输出 为 1。 
我 们 通过 把 第 二 个 过 程 单 元 上 面 的 权 值 改 为 1 (如 图 11-20c 所 示 ) 来 调整 这 个 值 。 现 在 ， 网 络 正确 
地 执行 了 输入 模式 1.0。 这 时 ， 我 们 回去 再 次 尝试 输入 模式 1,1。 但 令 人 失望 的 是 ， 网 络 不 再 正确 
地 处 理 那个 模式 。 实 际 上 ， 网 络 现在 产生 了 一 个 输出 1 〈 如 图 11-20d 所 示 )。 我 们 通过 把 第 二 个 过 
程 单元 上 面 的 权 值 改 回 0 来 调整 这 个 值 。 我 们 又 回 到 了 起 点 ， 继 续 这 个 过 程 仅 是 带 着 我 们 经 过 一 
个 无 穷尽 的 训练 循环 ， 我 们 所 做 的 每 一 个 修改 都 与 前 一 个 修改 抵消 了 。 


图 11-19 一 个 人 工 神经 网 络 


阐 运 的 是 ， 如 何 开发 成 功 的 训练 策略 已 经 取得 了 重大 的 进展 ， 前 一 节 引 用 的 ALVINN 项 目 
论证 了 这 一 点 。 实 际 上 ，ALVINN 是 一 个 人 工 神经 网 络 ， 如 图 11-21 所 示 ， 其 构成 出 奇 地 简单 。 
ALVINN 人 和 从 30x32 阵 列 的 传感器 中 获得 输入 ,每 个 传感器 负责 观察 前 面 道路 视频 图 像 的 一 个 特定 
部 分 ， 并 且 同 4 个 处 理 单元 的 每 一 个 报告 其 发 现 。( 从 而 ， 这 4 个 单元 的 每 一 个 都 有 960 个 输入 。) 
4 个 单元 的 每 一 个 的 输出 与 30 个 输出 单元 的 每 一 个 相连 接 ， 其 输出 预示 了 加 驶 的 方向 。 这 30 个 单 
元 行 一 端 处 于 兴奋 的 处 理 单元 指示 了 一 个 向 左 急 转弯 ， 而 另 一 端 处 于 兴奋 的 单元 则 指示 了 一 个 
向 右 急 转 弯 。 
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酒 林 一 辣 = | 


(a) 岗 格 正确 地 执行 输入 模式 1,1 


5 了 和 RE 


由 ) 网 络 错误 执行 输入 模式 1.0 


酒 计 一 上 攻 


〔《c) 第 二 个 处 理 单 元 上 部 的 权 被 调整 


得 


(d) 但 是 ， 网 络 不 再 正确 执行 输入 模式 1,1 
图 11-20 训练 一 个 人 工 神经 网 络 


ALVINN 有 的 训练 是 通过 “观察 ”一 个 人 的 驾驶 进行 的 。 当 它 要 做 出 自己 的 驾驶 决定 时 ， 它 
把 目 己 的 决定 与 人 的 决定 相 比较 ， 并 且 稍微 修改 其 权 值 使 其 更 接近 人 的 决定 。 然 而 ， 仓 在 一 个 
有 趣 的 附加 问题 ， 尽 管 ALVINN 通 过 它 的 简单 技术 学 习 驾 驶 ， 但 是 它 没 有 学 习 如 何 从 错误 中 恢 
复 过 来 。 因 此， 从 人 那里 收集 的 数据 也 要 人 工 强加 以 包含 恢复 状态 。 《这 种 恢复 训练 的 一 种 方法 
赴 把 它 在 最 初 就 考虑 进去 ， 使 人 令 交 通 工 具 偏离 方向 ， 以 便 ALVINN 可 以 通过 观察 人 来 学 习 如 
何 恢复 。 除 非 当 人 完成 初始 的 偏离 过 程 时 ALVINN 不 可 用 ， 和 否则 ， ALVINN 可 以 学 会 偏离 以 及 恢 
复 一 一 显然 ， 这 并 不 是 一 个 受 欢 迎 的 方法 。) 


11.5.3 联想 记忆 
和 人 脑 具 有 惊人 的 能 力 ， 能 够 从 当前 关心 的 情景 中 提取 与 之 关联 的 信息 来 。 当 闻 到 特定 气味 
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时 ， 我 们 很 容易 色 起 对 儿 时 的 回忆 ;， 朋友 的 声音 会 唤起 友人 的 身影 和 一 段 美 好 时 光 的 回忆 ;， 特 
定 的 音乐 可 能 会 产生 对 某 个 假日 的 怀念 。 这 些 就 是 联想 记忆 (associative memory) 的 例子 一 一 
提取 与 手头 信息 相关 联 的 或 相关 的 信息 。 


向 堪 生 转弯 自 行 向 右 急 转 订 


刁 国 - 用 史 
SS 
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NS 









处 理 单 元 
ni 





ee 


路 的 30X32 图 像 


几 11-21 ALVINN 的 结构 


构建 具有 这 种 联想 记忆 能 力 的 机 器 是 许多 年 来 研究 的 一 个 目标 。 途 径 之 一 是 应 用 人 工 神经 
网 络 技术 。 例 如 ， 考 虑 一 个 由 许多 处 理 单 元 组 成 的 网 络 ， 这 些 处 理 单 元 相互 连接 形成 一 个 没有 
输入 和 输出 的 网 《有些 设计 中 ， 一 个 单元 的 输出 连 到 其 他 单元 ， 作 为 每 个 单元 的 输入 ， 这 种 设 
丰 称 得 普 菲 尔 德 网 络 《Hopfield network)。 在 其 他 一 些 设计 中 ， 一 个 单元 的 输出 可 能 只 连 到 与 其 
直接 相 邻 的 单元 。) 每 个 单元 都 可 以 处 于 兴奋 状态 ， 也 可 处 于 抑制 状态 。 如 果 用 1 表示 兴 奋 状态 ， 
用 0 表示 抑制 状态 ,那么 整个 网 络 的 状况 可 以 想象 成 一 个 1 和 0 的 布局 。 现 在 假定 以 这 样 的 方式 对 
该 网 络 进行 编程 ， 也 束 征 使 得 东 些 0 和 1 布局 是 稳定 的 ， 也 就 是 说 ， 当 网 络 发 现 自 己 处 在 这 几 种 
布局 之 一 时 ， 它 就 保持 在 那个 布局 状态 。 如 果 网 络 所 处 的 布局 不 稳定 ， 那 么 处 理 单 元 之 间 的 互 
动 将 引起 布局 改变 ， 并 且 一 直 改 变 ， 直 到 变 成 一 个 稳定 布局 为 止 。 

现在 假设 我 们 用 1 表示 一 个 活跃 的 状态 ，0 表 示 抑 制 的 状态 ， 这 样 任 何 时 刻 的 整个 网 络 的 条 
件 都 能 被 想象 成 0 和 1 的 配置 。 然 后 ， 如 果 把 网 络 设置 为 一 个 接近 稳定 模式 的 位 模式 ， 我 们 可 以 
期 里 网络 矶 换 到 柱 吓 模式 。 换 到 之 ， 网 络 可 能 找到 接近 它 被 给 定 模式 的 稳定 位 模式 。 所 以 ， 如 
条 一 些 位 用 来 编码 成 “气味 ”， 另 一 些 位 用 来 编码 成 “ 儿 时 回忆 ”， 那 么 ， 根 据 某 个 稳定 布局 初 
设 的 “气味 ”， 能 够 导致 其 余 的 位 找到 关联 的 “ 儿 时 回忆 ?”。 

现在 我 们 考虑 图 11-22 亡 示 的 人 工 神经 网 络 。 图 中 每 个 圆圈 代表 一 个 处 理 单元 ， 其 益 值 
蕊 于 圆 中 。 连 接 圆圈 的 线 代表 相应 单元 间 的 双 癌 连接 。 也 就 是 说 ， 一 条 连接 两 个 单元 的 线 表 
示 每 个 单元 的 输出 连 到 妨 一 个 单元 作为 输入 。 因 此 , 中央 单元 的 输出 连 到 其 周边 每 个 单元 作 


起 
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为 输入 ， 而 周边 每 个 单元 的 输出 也 都 连 到 中 央 的 
单元 作为 输入 。 两 个 相连 的 单元 相互 的 输出 都 有 
相同 的 权 值 。 这 个 共同 的 权 值 记 在 连接 线 旁 。 于 
是 ， 图 中 项 部 那个 单元 从 中 央 单元 接收 的 输入 伴 
有 权 值 -1， 从 其 两 个 周边 邻居 接收 到 的 输入 伴 有 
权 值 1。 类 似 地 ， 中 央 单 元 从 周边 各 单元 接收 的 
输入 伞 有 权 值 -1。 

网 络 以 离散 的 步骤 运转 ， 每 ~- 步 ， 所 有 的 处 理 
单元 都 以 同步 方式 对 其 输入 作出 响应 。 为 了 从 网 络 
的 当前 布局 确定 其 下 一 步 布局 , 我 们 要 确定 整个 网 
络 中 每 一 个 单元 的 有 效 输入 , 再 让 所 有 的 单元 同时 
响应 其 和 输入。 结果， 整个 网 络 遵循 一 个 协调 的 顺序 





图 11-22 实现 联想 记忆 的 一 个 人 工 神 经 网 络 


运作 : 计算 有 效 输入 ， 响 应 输入 ， 计 算 有 效 输入 ， 响 应 输入 ， 依 次 类 推 ， 

如 妥 网 络 初始 化 为 最 右边 两 个 单元 为 抑制 状态 ， 其 他 单元 为 兴奋 状态 〈 见 图 11-23ay， 
我 们 来 考虑 会 发 生 的 一 系列 事件 。 最 左边 两 个 单元 有 效 输入 为 1， 所 以 保持 兴奋 ;但 它们 
周边 的 邻居 有 效 输入 为 0， 所 以 会 变 成 抑制 。 类 似 地 ， 中 央 单 元 有 效 输入 为 -4， 所 以 变 成 
抑制 。 于 是 ， 整 个 网 络 转变 成 图 11-23b 所 示 的 布局 ， 失 有 最 左边 两 个 单元 兴奋 。 因 为 中 央 
单元 现在 抑制 ， 所 以 最 左边 两 个 单元 的 兴奋 状态 将 导致 项 部 和 底部 两 个 单元 再 变 成 兴奋 。 
同时 ， 因 为 有 效 输入 为 -2， 中 央 单 元 继续 保持 抑制 。 于 是 网 络 转变 成 图 11-23c 所 示 的 布局 ， 
然后 它 又 导致 了 图 11-23d 所 示 的 布局 。( 如 果 网 络 初始 化 为 只 有 上 面 4 个 单元 兴奋 ， 那 么 会 
出 现 一 种 闪烁 现象 。 顶 部 单元 保持 兴奋 ， 而 其 2 个 周边 邻居 及 中 央 单 元 会 在 兴奋 与 抑制 两 


种 状态 间 不 断 切换 。) 





开始 : 除 最 右边 的 单元 外 
上 所 有 的 单元 都 兴奋 





步骤 2: 顶部 和 底部 单元 
查 为 兴奋 


{C) 





元 保持 兴 音 





最 后 : 所 有 边界 
单元 兴 奉 


(d 


图 11-23 ”导向 稳定 布局 的 步骤 
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最 后 ， 我 们 观察 到 这 个 网 络 有 两 种 稳定 布局 : 一 种 是 中 央 单 元 兴奋 ， 而 其 他 单元 抑制 
鸠 一 种 是 中 央 单 元 抑制 ， 而 其 他 单元 兴奋 。 如 果 网 络 初始 化 为 中 央 单 元 兴奋 而 其 他 单元 不 会 
有 2 个 以 上 兴奋 ， 那 么 网 络 会 走向 前 一 种 稳定 布局 。 如 果 网 络 初始 化 为 至 少 4 个 相 邻 周边 单元 
兴奋 ， 那 么 网 络 会 走向 后 一 种 稳定 布局 。 所 以 ， 可 以 说 ， 这 种 网 络 ， 如 果 初 始 模式 为 中 央 单 
元 及 少 本 3 小 周 边 单 元 处 于 兴奋 状态 ， 就 与 前 一 种 稳定 布局 相关 联 ， 如 果 初 始 模式 为 4 个 或 4 个 
以 上 周边 单元 处 于 兴奋 状态 ， 那 么 就 与 后 一 种 稳定 布局 相关 联 。 简 单 而 说 ， 这 个 网 络 时 现 一 
种 初步 的 联想 记忆 。 


问题 与 练习 
1. 对 于 下 面 的 处 理 单 元 ， 当 两 个 输入 都 是 1 时 ， 答 出 是 多 少 ? 如 果 输 入 模式 是 0.0、0.1 以 及 1.0 也 ? 


-1 .5 


2 珊 束 下 面 罗 处理 单元 的 权 值 和 阅 值 ， 使 得 当 且 仅 当 至 沙 有 两 个 输入 为 1 时 输出 为 1。 


尖 政 


3. 举 出 在 训练 一 个 人 工 神经 网 络 时 可 能 会 发 生 的 一 个 问题 。 
4. 图 11-22 中 ， 如 果 初 始 化 为 所 有 处 理 单元 抑制 ， 那 么 网 络 会 走 到 哪个 稳定 布局 ? 


工 生 ， 让 有 
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机 器 人 学 (robotics) 是 研究 具有 智能 行为 的 物理 上 的 自主 智能 体 的 一 门 学 科 。 对 于 所 有 的 
智能 体 ， 机 器 人 在 所 处 的 环境 中 必须 能 够 感知 、 推 理 和 发 生 作 用 。 因 此 ， 机 器 人 学 涵盖 了 人 工 
智能 的 所 有 研究 范围 ， 并 在 机 械 和 电子 工程 方面 引起 了 巨大 的 反应 。 

机 器 人 需要 用 机 械 装 置 来 回 移动 和 操作 目标 物体 来 与 外 界 交 互 。 在 早期 的 机 器 人 学 中 ， 该 
领域 与 操作 器 械 的 发 展 机 密 联 系 ， 这 些 操作 器 械 通常 是 带 有 肘 、 腕 及 手 或 工具 的 机 械 臂 。 研 究 
不 仅 涉 及 这 样 的 装置 如 何 操作 ,而且 涉 及 如 何 维护 和 应 用 有 关 它 们 的 定位 和 定向 的 知识 。( 你 闭 
上 眼睛 也 能 够 用 手 摸 到 你 的 鼻子 ， 因 为 你 的 大 脑 保 存 有 你 的 鼻子 和 手指 在 什么 地 方 的 记录 。) 随 
着 时 间 的 推移 ， 机 械 臂 已 经 越 来 越 灵 巧 ， 使 用 基于 强 反 馈 的 触觉 ， 机 械 臂 能 够 成 功 地 握 住 鸡 绰 
和 纸杯 。 

最 近 ， 快 速 、 轻 便 计 算 机 的 发 展 引 发 了 移动 机 器 人 方面 更 重大 的 研究 。 这 种 灵活 性 的 实现 
导致 了 大 量 的 富有 创意 的 设计 。 在 机 器 人 移动 能 力 方面 , 研究 人 员 已 经 开发 出 可 以 像 鱼 一 样 游 、 
像 晴 姐 一 样 飞 、 像 蝗虫 一 样 跳 跃 、 像 蛇 一 样 昱 晓 疏 行 的 机 器 人 。 

因为 带 有 轮子 的 机 器 人 相对 容易 设计 和 建造 , 所 以 非常 受 欢迎 , 但 是 它 受 到 了 可 以 穿 过 
的 地 形 的 限制 。 使 用 轮子 和 导轨 的 联合 体 , 克服 这 种 限制 耻 楼 梯 或 翻越 岩石 是 当前 的 研究 目 
标 。 例 如 , 美国 国家 航空 航天 局 的 火星 探 路 者 号 就 是 使 用 特殊 设计 的 轮子 在 火星 的 岩石 旺 上 
行走 。 

有 腿 的 机 器 人 提供 了 较 大 的 可 移动 性 ， 但 是 相当 复杂 。 例 如 ， 设 计 能 像 人 一 样 行走 的 两 条 
腿 机 器 人 必须 持续 地 监视 和 调整 其 密 态 ， 否 则 它 将 会 跌倒 。 但 是 ， 这 种 困难 能 够 被 克服 ， 例 如 
本 田 公司 开发 的 两 条 腿 的 具有 人 的 特征 的 机 器 人 Asimo， 能 够 上 楼 梯 ， 甚 至 能 够 跑 。 

尽管 在 操作 器 械 和 移动 能 力 方面 取得 了 巨大 的 进步 ， 但 是 大 多 数 机 器 人 仍然 不 是 非常 自主 


上 
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的 。 工 业 机 械 人 手臂 是 为 每 个 任务 专门 严格 设计 的 ， 工 作 时 不 用 传感器 ， 它 假设 零件 将 会 按照 
指定 的 位 置 被 精确 地 传送 给 它们 。 其 他 的 移动 机 器 人 《如 美国 国家 航空 航天 局 的 火星 探 路 者 号 
和 军用 无 人 机 ) 其 智能 依靠 人 的 操作 来 实现 。 

克服 这 种 对 人 的 依赖 是 当前 研究 的 一 个 主要 目标 。 一 个 问题 涉及 一 个 自主 的 机 器 人 需要 知 
道 关 于 其 所 处 环境 的 哪些 知识 ， 以 及 需要 预先 计划 其 行为 到 什么 程度 。 建 造 机 器 人 的 一 个 方法 
是 维持 所 处 环境 的 详细 记录 ， 该 记录 还 包含 目标 物体 的 一 个 详细 目录 以 及 它们 的 方位 ， 通 过 这 
些 信息 制定 行动 的 详细 计划 。 这 个 方向 的 研究 很 大 程度 上 依靠 知识 表示 和 知识 存储 的 进展 以 及 
推理 和 规划 技术 的 改进 。 

另 一 个 可 选择 的 方法 是 开发 反应 型 机 器 人 ， 该 方法 不 用 保持 复杂 的 记录 以 及 在 构建 详细 行 
动 计划 上 耗费 大 量 的 精力 ， 只 要 应 用 简单 的 与 外 界 交互 的 规则 时 时 刻 刻 指导 它们 的 行为 。 反 应 
型 机 器 人 技术 的 支持 者 认为 ， 当 计划 一 个 长 途 汽车 旅行 时 ， 人 类 不 会 预先 制定 全 面 而 详细 的 计 
划 ， 相 反 ， 他 们 仅 是 选择 主要 路 线 ， 而 对 于 像 到 哪儿 吃饭 ， 走 哪些 出 口 ， 以 及 如 何 绕道 行驶 等 
细节 到 时 候 考虑 。 同 样 ， 一 个 需要 通过 一 条 拥挤 的 走廊 或 从 一 栋 大 楼 走 到 另 一 栋 大 楼 的 反应 型 
机 器 人 不 会 预先 制定 非常 详细 的 计划 ， 但 是 当 碰 到 障碍 时 ， 它 会 应 用 简单 的 规则 避 开 每 一 个 障 
碍 。 这 是 历史 上 最 畅销 的 机 器 人 一 一-iRobot Roomba 真 空 吸尘器 所 采用 的 方法 ,真空 吸尘器 以 反 
应 模式 在 地 面 上 来 回 移动 ， 而 不 会 为 记 住家 具 的 详细 信息 和 其 他 障碍 而 费心 。 毕 竟 ， 家 庭 穹 物 
下 次 不 可 能 在 同一 个 地 方 。 

当然 ， 单 一 的 方法 并 不 是 对 于 所 有 情况 都 是 最 好 的 。 真 正 的 自主 机 器 人 最 有 可 能 是 使 用 
多 层 标准 的 推理 和 计划 ， 应 用 高 层 技术 设 定 和 达到 主要 目标 ， 低 层 反应 系统 完成 次 要 目标 ， 
这 种 多 层次 推理 的 例子 可 在 Robocup 比 赛 一 个 机 器 人 足球 队 的 国际 性 比赛 ) 中 发 现 ， 该 比赛 
为 到 2050 年 开发 能 够 对 抗 世 界 级 人 类 足球 队 的 机 器 人 足球 队 的 研究 提供 了 - -个 场合 。 这 里 ， 
重点 不 是 仅仅 建造 能 够 “ 踢 ” 球 的 移动 计算 机 ， 而 是 设计 一 个 能 够 相互 协作 达到 共同 目标 的 
机 器 人 足球 队 。 这 些 机 器 人 不 仅 要 移动 和 对 自己 的 行为 做 出 推断 ， 而 且 它们 还 要 对 队友 和 对 
手 的 行为 做 出 推断 。 

机 器 人 学 研究 领域 的 另 一 个 例子 是 称 为 进化 机 器 人 学 的 领域 ， 把 进化 理论 应 用 于 开发 低 
级 反应 规则 和 高 级 推理 。 这 里 我 们 发 现 ， 适 者 生存 理论 用 到 了 设备 的 开发 上 ， 经 过 若干 代 的 
学 习 ， 这 些 设备 能 够 自己 获得 平衡 或 移动 的 方法 。 关 于 这 个 领域 的 许多 研究 不 同 之 处 在 于 机 
器 人 的 内 部 控制 系统 《很 大 程度 上 是 软件 ) 及 其 形体 的 物理 结构 。 例 如 ， 一 个 能 游 沪 的 师 旦 
机 器 人 的 控制 系统 换 成 一 个 有 腿 的 类 似 机 器 人 。 然 后 在 控制 系统 中 应 用 进化 技术 ， 得 到 一 个 
能 改行 的 机 器 人 。 在 其 他 的 例子 中 ， 进 化 技术 已 经 被 应 用 在 机 器 人 的 物理 形体 上 ， 让 传感器 
发 现 执行 特定 任务 的 最 佳 位 置 。 更 具有 挑战 性 的 研究 正在 寻求 软件 控制 系统 与 形态 结构 同时 
进化 的 途径 。 

要 列 出 机 器 人 学 研究 带 来 的 所 有 令 人 难忘 的 成 果 是 一 项 太 大 的 任务 ， 当 前 的 机 器 人 与 科幻 
电影 和 小 说 中 的 超 能 机 器 人 相差 其 远 ， 但 是 在 执行 特定 任务 上 已 经 取得 了 重大 的 成 功 。 我 们 使 
机 器 人 能 够 驾驶 交通 工具 ， 像 宠物 狗 一 样 表现 ， 为 武器 导航 。 然 而 ， 享 受 这 些 成 功 的 同时 ， 我 
们 应 该 注意 ， 对 人 造 宠物 狗 的 钟情 以 及 智能 武器 的 可 怕 威 力 带 来 了 社会 问题 和 伦理 问题 ， 这 些 
都 向 社会 发 出 了 挑战 。 我 们 的 未 来 是 我 们 自己 造就 的 。 


问题 与 练习 
1 对 于 机 器 人 行为 的 反应 方法 在 何 种 方式 上 有 列 于 更 传统 的 “ 基 二 的 和 为 
2. 当前 机 器 人 学 领域 研究 的 几 个 主题 有 哪些 ? 


3. 进化 理论 用 在 机 器 人 开发 的 哪 两 个 层次 ? 
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毫 无 疑 间 ， 人 工 智 能 的 进展 有 造福 人 类 的 潜能 ， 人 们 很 容易 热衷 于 这 些 潜 在 的 好 处 。 然 而 ， 
将 来 也 隐藏 着 淤 在 的 危险 ， 它 的 破坏 性 后 条 与 其 有 利 的 那 一 面 同 梓 已 大。 这 种 这 计 币 币 仅 在 于 
一 个 人 的 观点 或 一 个 人 的 社会 地 位 的 不 同一 一 彼 之 所 得 ， 此 之 所 失 。 所 以 花 一 点 时 间 从 另外 一 
个 角度 观察 正在 进步 的 技术 对 于 我 们 来 说 是 比 轻 怡 当 的 。 

有 些 人 把 技术 的 进步 看 成 是 给 与 人 关 的 一 份 悍 礼 一 一 将 人 关 从 枯 侣 的 、 普 通 的 任务 中 解放 
出 来 ， 为 更 愉 局 的 生活 方式 打开 大 门 的 一 种 方式 。 但 对 于 同一 个 现象 ， 夯 一 些 人 则 把 它 看 作 是 
刊 村 公民 就 业 机 会 、 把 财 曲 引 回 权 执 人 物 的 袖 根 。 其 实 ， 这 正 是 印度 忠诚 的 人 道 主义 者 圣 雄 甘 
地 所 预言 的 。 甘 地 再 三 地 辩 称 ， 如 果 用 农夫 家 尾 手 纺 车 来 代 蔡 大 型 纺织 工矿， 那么 印度 人 的 生 
活 将 会 变 得 更 好 。 他 断言 ， 通 过 这 个 途径 ， 可 以 用 一 个 分 敌 的 大 宗 生 产 系 统 取代 只 能 雇用 少数 
人 的 集中 式 大 衬 生产 ， 这 将 有 利于 平民 大 挫 。 

历史 上 有 很 多 因 财 富 和 权力 分 配 不 均 而 引起 的 革命 。 如 果 今 天 正在 进步 的 技术 使 得 这 种 车 
殊 更 为 巩固 ， 那 将 产生 灾难 性 的 后 果 。 

但 是 ， 建 造 越 来 越 智能 的 机 器 的 后 果 ， 比 对 付 不 同 社会 族群 间 的 权力 斗争 的 后 果 更 加 微 





钞 一 一 更 加 根本 。 这 些 问 题 震 气 了 人 类 目 号 形 象 的 核心 。19 世 纪 ， 达 和 尔 文 的 进化 论 及 人 类 可 能 


由 更 低 等 的 生命 形式 进化 而 来 的 想 流 震 怀 了 整个 社会 。 那 么 ， 面 对 机 懂 的 心智 能 力 加 人 关 挑 成 
的 冲击 ， 社 会 将 如 何 芭 应 呢 ? 

过 去 ， 拉 术 上 发 展 缓慢 ， 有 时间 让 我 们 重新 调整 智能 的 概念 ， 维 护 人 类 的 目 我 形象 。19 世 纪 ， 
我 们 的 老 祖宗 会 认为 当时 的 机 械 装 置 具有 超自然 的 能 力 ， 而 今天 我 们 决 不 会 认为 这 些 机 械 有 什 
么 智能 。 但 是 ， 如 果 机 器 真 的 挑战 了 人 类 的 智能 ， 或 者 更 有 可 能 的 是 机 器 能 力 的 进步 超过 了 我 
们 的 适应 能 力 ， 那 么 人 类 将 如 何 应 对 呢 ? 

考虑 一 下 20 世 纪 中 期 社会 对 当时 IQ 测 试 的 反 啊 ， 也 许可 以 从 中 得 到 一 些 线索 ， 看 看 人 类 
面 对 挑 战 我 们 智能 的 机 器 时 的 潜在 反应 。 这 些 测试 被 认为 可 以 用 来 确定 孩童 的 智力 水 平 。 美 
国 的 孩童 带 常 依据 他 们 在 测试 中 的 表现 来 分 美 ， 并 据 此 制定 相应 的 教育 计划 。 随 之 ， 受 教育 
的 机 会 朵 那些 在 测试 中 表现 展 好 的 臣子 开放 ， 而 那些 出 试 表 现 和 过 的 苇子 只 能 安排 去 参加 补习 
计划 。 简 而 言 之 ， 当 给 出 一 种 扩 度 来 衡量 个 体 的 智能 时 ， 社 会 会 慑 问 于 汇 视 租 认 为 是 低 于 这 
个 尺度 的 那些 人 的 能 力 。 那 么 ， 如 果 机 器 的 “智能 ”能 力 已 经 变 得 可 与 人 类 相 匹 敌 ， 甚 全 只 
是 看 上 去 可 以 相 匹 敌 ， 社 会 将 怎样 应 对 这 种 局 面 呢 ? 抑或 社会 也 漠视 那些 能 力 看 上 去 不 如 机 
器 的 人 ? 如 果 这 样 , 对 于 社会 的 这 些 成 员 来 说 , 后 果 是 什么 ? 难道 一 个 人 的 尊严 取决 于 他 (她 ) 
与 机 器 比较 的 绪 果 吗 ? 

我 们 已 经 开始 看 到 ， 在 一 些 特定 场合 ， 人 类 的 智力 正面 临 机 器 的 挑战 。 机 器 现在 有 能 力 打 
败 棋 王 ;计算 机 化 的 专家 系统 能 够 给 出 治疗 意见 ; 管理 证 辩 投 资 的 简单 程序 常 带 比 投资 专家 做 
得 更 好 。 这 样 的 一 些 系 统 怎 样 影响 所 涉及 人 员 的 目 身 形象 ? 随 着 在 越 来 越 多 的 领域 里 个 人 被 机 
器 胜出 ， 个 人 的 自尊 心 会 受到 怎样 的 影响 ? 

由 于 人 是 生物 ， 而 机 器 不 是 ， 所 以 许多 人 认为 机 器 拥有 的 智能 与 人 类 的 智能 有 着 本 质 的 区 
列 。 因 此 他 们 认为 机 右 永 远 不 会 再生 出 人 类 的 决策 过 程 。 机 器 也 许 会 得 到 与 人 同样 的 结论 ， 但 
是 得 到 这 些 结论 所 依赖 的 基础 与 人 类 并 不 相同 。 那 么 在 怎样 的 程度 上 存在 不 同类 型 的 智能 ? 对 
于 社会 来 说 ， 如 果 遵 循 非 人 类 智能 提出 的 道路 运作 ， 是 否 合乎 道德 ? 

Joseph Weizenbaum 在 他 的 Coraputer Power and xnam 民 Reason 一 书 中 坚决 反对 不 加 抑制 地 
应 用 人 工 智 能 ， 他 这 样 写 到 
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计算 机 能 够 做 出 司法 判决 ， 计 算 机 能 够 作出 精神 病 判 定 。 它 们 能 够 以 比 最 有 耐心 
的 人 更 加 老练 的 方式 投 摔 硬 币 。 关键 在 于 不 应 当 给 它们 这 些 任务 .在 某 些 场合 ， 它 们 
甚至 能 够 得 到 “正确 的 "” 决策 一 一 但 是 其 依赖 的 基础 总 是 而 且 一 定 不 是 人 类 所 乐于 接 
受 的 。 

已 经 有 很 多 有 关 “ 计 算 机 与 人 脑 ” 的 争辩 。 我 在 这 里 的 结论 是 ， 问 题 的 实质 不 在 
于 技术 ， 黄 至 也 不 在 于 教学 ， 而 在 于 伦理 道德 。 设 定 计算 机 去 做 什么 ， 不 能 用 “能够 
不 能 够 ”这 样 的 问题 ， 计 算 机 适用 性 的 限制 最 终 只 能 根据 “应 当 ” 来 表达 ， 最 基本 的 
认识 应 该 是 : 因为 我 们 现在 还 没有 办 法 让 计算 机 有 智慧 ， 那 么 我 们 现在 就 不 应 当 让 计 
划 机 去 做 有 智慧 的 工作 。 
也 许 你 会 认为 本 节 所 述 的 许多 内 容 近 乎 科幻 小 说 ， 而 不 是 计算 机 科学 。 就 在 不 久 前 ， 许 多 


“人 因 抱 有 同样 的 “这 永远 不 会 发 生 ” 的 态度 ， 而 拒绝 考虑 “如 果 计 算 机 操纵 了 社会 ， 会 发 生 什 


么 ”但 从 许多 方面 来 看 ， 这 一 天 现在 已 经 来 临 。 如 果 一 个 计算 机 化 的 数据 库 错 报 了 你 有 不 良 的 
信用 度 、 有 犯罪 记录 或 是 银行 账户 透支 ， 那 么 ， 是 计算 机 的 报告 会 奏效 还 是 你 自己 的 清白 申诉 
会 奏效 ? 如 果 一 个 不 正常 的 导航 系统 错误 指示 了 大 雾 笼 单 的 跑道 位 置 ， 那 么 飞机 将 降落 看 何 
处 ? 如 果 一 个 机 器 用 来 预测 公众 对 不 同 政治 决策 的 反应 ， 那 么 一 个 政治 家 应 采取 何 种 决策 ? 你 
遇 到 过 多 少 次 因为 “计算 机 坏 了 ”所 以 服务 员 无 法 为 你 服务 的 情形 ? 那么 ， 究 竟 谁 学 管 着 这 个 
社会 ? 我 们 还 没有 准备 让 社会 届 从 于 机 器 吗 ? 


问题 与 练习 

1 如 有 本 把 过 去 100 年 来 发 明 的 所 有 机 器 都 去 掉 ， 那 么 今天 的 人 还 有 多 少 能 幸存 ? 如 果 是 过 去 50 年 呢 ? 20 
年 呢 ? 幸存 者 会 在 何 处 ? 

2. 你 的 生活 在 多 大 程度 上 被 机 器 所 控制 ? 蕉 又 控制 着 这 些 影响 你 生活 的 机 器 ? 

-你 从 哪里 获得 那些 你 的 日 常 决策 赖 以 为 基础 的 信息 ? 对 于 你 的 重大 决策 呢 ? 对 这 些 信 息 的 准确 雇 你 
有 和 多少 把 握 ? 为 什么 ? 


[Ji 





复习 题 四 
( 带 * 的 题目 涉及 选读 小 节 的 内 容 ) 脑 的 记忆 能 力 , 那么 为 机 器 所 开发 的 程序 必定 
1. 正如 11.2 节 说 明 的 那样 ， 人 类 会 用 一 个 问题 来 要 达 到 机 器 的 最 佳 存储 能 力 ? 请 解释 “。 
表达 某 个 目的 , 而 不 是 提问 。 另 一 个 例子 ,“ 你 5 举 出 几 个 陈述 性 知识 的 例子 。 举 出 一 个 过 程 性 
知道 你 的 轮胎 漏 气 了 吗 ? ”, 这 也 是 用 来 提醒 知识 的 例子 。 
而 不 是 问 。 给 出 一 些 问题 的 例子 ,目的 是 用 来 “06. 在 面向 对 银 程 序 设计 的 环境 中 ， 一 个 对 象 的 哪 
表达 安奈、 警告 或 责备 。 竖 部 分 是 用 来 存储 陈述 性 知识 ? 哪些 部 分 用 来 
2 把 一 个 苏打 水 剂量 器 当 作 一 个 智能 体 来 进行 存放 过 程 性 知识 ? 
如 下 分 析 : 它 的 传感器 是 什么 ? 它 的 效应 器 是 7 下 列 活 动 中 , 你 认为 哪些 是 面向 性 能 的 ? 哪些 
什么 ? 它 可 以 展现 什么 级 别 的 反应 〈 本 能 反 是 面 问 模拟 的 ? 
应 、 基 于 知识 或 基于 目标 ) ? a. 一 个 飞行 模拟 器 的 设计 。 
3， 确定 下 列 每 一 个 反应 , 是 本 能 反应 、 基 于 知识 b. 一 个 自动 导航 系统 的 设计 。 
的 反应 还 是 基于 目标 的 反应 。 论 证 你 的 回答 。 5 一 个 处 理 图 书馆 藏书 的 数据 库 的 设计 。 
a_ 门 一 开 ， 电 冰箱 里 的 灯 就 亮 了 。 d. 一 个 用 于 理论 测试 的 国家 经 济 模 型 的 设计 。 
b. 一 个 计算 机 程序 把 文本 从 德 文 翻 译 成 英文 。 e， 一 个 用 于 监视 病人 生命 体征 的 程序 的 设计 。 


总 


c, 一 个 登山 者 计划 登山 路 径 。 . 当今 ,许多 商用 电话 的 呼叫 都 采用 了 自动 应 
4. 如 采 一 个 研究 人 员 使 用 计算 机 模型 来 研究 人 答 系 统 ， 系 统 根 据 打 电话 人 的 选项 直接 呼 





站 1 0. 


叫 。 这些 系 统 通 过 了 图 灵 测 试 吗 ? 请 解释 你 
的 答案 。 


, 确定 能 用 来 区 分 符号 DO、G、C、Q 的 一 组 几何 


特征 。 

请 描述 通过 与 模板 比较 鉴别 特性 的 技术 与 第 1 
章 介 绍 的 利用 纠 错 码 鉴定 特性 的 技术 之 间 的 
相似 之 处 。 


. 根据 下 面 线 绘图 中 标记 A 的 那个 攻 是 凸 起 还 


是 凹 下， 说 明 这 个 图 的 两 种 解读 。 


起 


.比较 下 列 两 个 句子 中 介词 短语 的 作用 ( 仅 有 一 


个 词 的 不 同 ) 。 如 何 对 一 台 机 器 网 程 让 它 做 这 
样 的 区 分 ? 


The Pigpen Was built by the barn. 
The pigpen was built by the farmeT. 


:下面 两 个 句子 的 语法 分 析 的 绽 梨 有 什么 不 


同 ? 语义 分 析 的 结果 有 什么 不 同 ? 


Theodore rode the Zebra. 
The zebra was midden by Theodore. 


. 下 面 两 个 句子 的 语法 分 析 的 结果 有 什么 不 


同 ? 语义 分 析 的 结果 有 什么 不 同 ? 


If 其 =S then add 1 to 其 人 lse subtract ] from 入， 
下 其 天 thenm subtract 1 from 其 else add 1 to 其 ， 


. 正文 中 , 我 们 与 形式 程序 设计 语言 相 比 ， 简 要 


， 讨论 了 理解 自然 语言 的 问题 , 作为 讨论 目 然 芋 


1] ，/， 


18， 


言 案例 所 涉及 的 复 录 性， 给 出 问题 “Do you 
know what time it is?” 有 不 同 售 匀 的 情形 。 


, 一 个 句子 上 正文 的 改变 能 够 改变 这 个 句子 的 


含义 以 及 意思 。 图 11-4 的 上 下 文中 ， 如 果 两 人 
都 出 生 于 20 世 纪 60 年 代 ， 那 么 句子 “Mary hit 
John.” 的 含义 等 样 改变 ? 如 果 一 个 出 生 在 20 
世纪 60 年 代 ， 而 另 一 个 出 生 在 20 世 纪 90 年 代 ， 
那么 含义 如 何 改变 ? 

于 一 个 语义 网 ， 把 下 列 段 落 的 意思 表示 出 来 。 
Jonna threw the hall to Jack，who hit it Into 
center fielid. The center fielder tried to catch it， 
but lt bounmced of 寻 t 帆 e 二 al lnistead. 


有 时 候 回 答 一 个 问题 的 能 妨 , 更 多 恢 末 于 对 访 


19. 
20. 
. 在 产生 式 系统 中 , 状态 图 和 搜索 树 有 什么 区 


二 


ii 
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复习 题 355 
知识 的 限度 的 了 解 ， 而 不 是 对 事实 本 身 的 知 
晓 。 例 如 ， 假 定数 据 库 A 和 B 都 包含 一 个 完整 
的 雇员 和 名单 ,该 名 单 与 公司 健 康 保险 程序 相关 
联 。 但 是 只 有 数据 库 A 知 道 名 单 是 完整 的 。 那 
么 关于 一 个 不 在 名 单 里 的 员工 ,数据库 A 能 够 
推断 出 什么 信息 是 数据 库 B 做 不 到 的 ? 

举 出 一 个 封闭 世界 假设 导致 和 矛盾 的 例子 。 

举 出 两 个 例子 ， 共 用 一 个 封闭 世界 假设 。 


别 ? 

依照 一 个 产生 式 系 统 分 析 和 解决 魔方 问题 的 任 

务 〈 什 么 是 状态 ? 什么 是 产生 式 ， 等 等 ? ) 。 

a. 假定 搜索 树 是 一 个 二 叉 树 ， 达 到 目标 需要 
10 个 产生 式 。 如 果 该 树 是 以 广度 优先 的 方 
式 构 建 的 ， 那 么 当 达 到 目标 状态 时 ， 树 中 
最 大 的 结 点 数 是 和 多少? 

b. 解释 通过 同时 构建 两 个 搜索 如 何 能 够 减少 
搜索 过 程 中 考虑 的 全 部 结 点 数目 一 一 一 个 
搜索 从 初始 状态 开始 ， 同 时 另 一 个 搜索 从 
目标 状态 逆向 进行 直到 这 两 个 搜索 会 合 。 
《假设 记录 在 道 向 搜索 过 程 中 发 现 的 状态 
的 搜索 树 也 是 一 个 二 叉 树 ， 并 且 两 个 搜索 
以 相同 速度 进展 。) 

正文 中 我 们 提 到 , 产生 式 系统 通常 被 用 来 作为 

从 已 知事 实 中 得 出 结论 的 一 种 技术 .系统 的 状 

态 是 推理 过 程 的 每 一 个 阶段 认为 是 真 的 事实 ， 

产生 式 对 于 操纵 已 知事 实 来 说 是 还 辑 规则 ,。 标 

识 几 个 逻辑 规则 , 使 从 事实 “John is a basketball 

player”， “Basketball playver are not short ， 以 

及 “John is either short or tall” 中 能 够 得 出 结 

论 “John is tall” 


. 下 面 的 树 表 示 一 个 融融 镶 戏 中 可 能 的 移动 , 选 


手 和 当前 可 在 移动 A 和 移动 B 中 选择 其 一 。 选 
手 X 称 动 后 ， 选 手 Y 跟 钾 选 一 移动 ， 然 后 选手 
X 在 跟着 选择 最 后 一 步 。 树 的 叶子 结 点 标记 为 
W、L、T， 分 别 代 表 选 手 X 最 后 是 赢 、 输 还 是 
平局 。 选 手 必 应 选择 移动 A 还 是 移动 B? 为 什 
么 ?在 一 个 竞赛 性 的 游戏 中 选取 一 个 “产生 式 ” 
和 一 个 如 8 数码 游戏 这 种 单 人 庆 戏 中 的 选取 有 
什么 不 同 ? 
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第 11 章 人 工 知 能 


按照 产生 式 系 统 分 析 跳 棋 游 戏 , 并 描述 一 个 用 
来 在 两 个 状态 中 确定 一 个 更 接近 目标 的 启发 。 
这 种 情况 中 的 控制 系统 与 一 个 如 8 数码 游戏 这 
种 单 人 游戏 中 的 控制 系统 有 什么 区 别 ? 

把 代数 定律 看 作 产 生 式 , 代数 式 简化 的 问题 就 
能 在 产生 式 系统 的 上 下 文中 解决 ,确定 一 组 代 
数 产生 式 ， 使 等 式 3/(C2x+l)=2/2xr-2) 简 化 为 
xz=4。 当 进行 这 种 代数 简化 时 ， 一 些 经 验 法 则 
《 即 启 发 法 则 ) 是 什么 ? 

不 用 任何 启发 信息 的 帮助 , 画 出 利用 广度 优先 
搜索 方法 解决 如 下 初始 状态 的 8 数码 游戏 生成 
的 搜索 树 。 


利用 图 11-10 的 算法 解决 第 28 题 的 8 数码 游戏 ， 
用 未 到 位 的 方块 的 数目 作为 启发 信息 , 画 出 搜 
索 树 。 

利用 图 11-10 的 算法 解决 如 下 初始 状态 的 8 数码 
话 戏 ， 假 设 使 用 与 11.3 节 中 一 样 的 启发 信息 ， 
硬 出 搜索 树 。 


当 解 决 8 数码 游戏 时 , 为 什么 用 未 到 位 的 方块 的 


数目 作为 启发 信息 不 如 11.3 节 用 的 那 种 好 ? 
执行 二 叉 树 搜索 (5.5 节 ) 时 决定 考虑 哪 一 半 
列表 的 技术 , 和 执行 一 个 启发 时 决定 要 执行 哪 
个 分 支 的 技术 ， 二 者 有 什么 不 同 ? 

注意 , 如 果 一 个 产生 式 系统 的 状态 图 中 有 一 -个 
状态 的 启发 值 与 其 他 状态 相 比 极其 低 , 并 且 如 
果 从 这 个 状态 到 自己 有 -个 产生 式 ， 那 么 图 
11-10 的 算法 会 陷入 一 个 循环 ， 一 遍 又 一 遍地 
考虑 这 个 状态 。 说 明 如 果 执 行 该 系统 中 任何 产 
生 式 的 代价 至 少 为 1， 那 么 把 启发 值 加 上 沿 正 
遍历 的 路 径 到 达 该 状态 的 代价 , 通过 这 样 计算 
预测 的 代价 ， 就 可 以 避免 这 种 无 限 循环 。 

在 一 幅 大 的 交通 图 上 寻找 两 个 城市 间 的 道路 ， 
你 会 用 怎样 的 启发 。 

列 出 可 用 于 产生 式 系统 的 启发 所 具有 的 两 个 
特性 。 

假定 有 两 个 桶 ,一 个 客 量 是 3 升 ， 一 个 容量 是 5 
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才 1. 


4 2. 


升 .任何 时 候 你 都 可 以 把 水 从 一 个 桶 倒 入 另 一 
个 桶 ， 把 一 个 桶 倒 空 ， 或 把 一 个 桶 倒 满 。 问 题 
和 定 要 将 正好 4 升 的 水 注入 5$ 升 的 那个 桶 。 说 明 这 
个 问题 如 何 可 以 设计 成 一 个 产生 式 系统 。 
假设 你 的 任务 是 监督 两 辆 卡车 装 货 , 每 辆 车 最 
多 可 载 14 吨 货 。 货 物 装 在 不 同 的 管 里 , 总 重 28 
吨 , 但 每 一 能 的 重量 不 一 样 ， 都 标 在 各 自 的 公 
边 上 。 为 了 在 两 辆 车 上 分 装 这 些 货 物 ， 你 会 采 
用 什么 样 的 探索 ? 


. 下 列 哪 些 是 元 推理 的 例子 ? 


a. 他 还 设 走 多 长 时 间 所 以 没 走 远 。 

b. 因为 我 经 常 做 出 错误 的 决定 ， 而 所 作 的 最 
后 两 个 决定 是 正确 的 ， 那 么 我 将 道 转 下 一 
个 决定 。 

c. 我 有 些 疲 仅 了 ， 所 以 我 想 我 将 要 打 个 上 吨 。 

d 我 有 些 疫 倦 了 , 所 以 我 可 能 不 会 清晰 地 思考 。 

描述 人 类 解决 框架 问题 的 能 力 如 何 帮 助人 类 

找到 丢失 的 项 目 。 


' a 通过 模仿 学 习 与 通过 监督 学 习 在 何 种 意义 


上 相似 ? 
b. 通过 模仿 学 习 与 通过 监督 学 习 在 何 种 意义 
上 不 同 ? 
下 留 表示 一 个 用 于 11.5 节 讨论 的 联想 记忆 的 
一 个 人 工 神经 网 络 。 如 果 模 式 中 只 有 2 个 单元 
兴 和 闪 ， 而 这 2 个 单元 被 一 个 单元 分 开 ， 那 么 它 
与 什么 模式 相关 联 ? 如 果 网 络 初始 时 所 有 单 
元 都 兴奋 ， 会 发 生 什 么 情况 ? 





下 图 表示 一 个 用 于 11.5 节 讨论 的 联想 记忆 的 一 
个 人 工 神 经 网 络 。 如 果 初 始 模式 中 至 少 有 3 个 单 
元 兴 备 ， 而 中 央 单 元 抑制 ， 那 么 它 与 怎样 的 稳 
定 布局 相关 联 ? 如 果 初 始 模式 中 只 有 2 个 相对 
的 周边 单元 兴奋 ， 那 么 将 会 发 生 什么 情况 ? 





二 3. 


二 和. 


49. 


50U， 


Tree 和 a 而 如 了 


社会 问题 


设计 一 个 用 于 联想 记忆 《11.5 节 所 讨论 的 ) 的 
人 工 神 经 网 络 , 它 由 一 个 处 理 单 元 年 形 队 列 组 
成 , 要 移动 到 这 样 的 稳定 模式 ， 其 中 一 个 纵 列 
的 单元 都 兴 大 。 


. 调整 图 11-19 所 示 的 人 工 神 经 网 络 中 的 权 值 和 


闪 值 ， 使 其 在 2 个 输入 相同 《全 为 0 或 全 为 1) 
时 输出 为 1,2 个 输入 不 同 ( 一 个 为 0 另 一 个 为 1) 
时 的 输入 为 0。 


. 团 一 个 与 图 11-6 类 似 的 图 ， 表 示 把 代数 式 


7x+3=3xr-5 简 化 为 三 -2 的 过 程 。 
伞 述 上 古 的 答案 ， 说 明 其 他 路 径 ， 解 题 时 可 道 
循 一 个 控制 系统 。 


. 画 一 个 与 图 11-6 类 似 的 图 ， 表 示 从 初始 事实 


“Polly is aparrot”、“A parrot is abird” 以 及 
“All birds can 人 hy ”中 得 到 结论 “Polly can fly” 
的 推理 过 程 。 

与 上 题 中 的 句子 不 同 , 有 些 岛 不 会 飞 ， 如 明 鸟 
或 是 折 了 翅膀 的 乌 。 但 是 ,要 建立 一 个 演绎 推 
理 系统 ， 其 中 把 对 陈述 “All birds can fy” 的 
所 有 例外 都 明确 列 出 ， 看 来 并 不 合理 。 那 么 ， 
我 们 作为 人 类 如 何 确定 一 只 乌 是 能 飞 还 是 不 
能 瓜 ? 

详 述 句子 “TI read the new tax law” 在 不 同上 下 
文中 的 不 同 含义 。 

说 明 怎 样 能 够 把 从 一 个 城市 旅行 到 另 一 个 城 
市 的 问题 设计 成 一 个 产生 式 系 统 。 什 么 是 状 
态 ? 什么 是 产生 式 ? 
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社会 问题 357 

假定 你 要 执行 A_B 和 C3 个 任务 ,它们 可 以 以 

任何 网 序 执行 《但 不 能 同时 ) 。 说 明 这 个 问 

题 如 何 设计 成 一 个 产生 式 系 统 ， 并 画 出 其 状 

态 图 。 

对 于 上 一 感 中 状态 图 ， 如 果 任 务 C 一 定 要 在 任 

务 A 之 前 执行 ， 那 么 怎样 改变 状态 图 ? 

a. 如 果 记 号 忆 用 用 来 表示 “者 一 个 列表 中 第 ; 
位 置 的 项 大 于 第 /位 置 的 项 ， 则 把 两 项 交 
换 ”， 其 中 大 为 正 整 数 ， 那 么 下 面 两 个 序 
列 中 哪 一 个 更 好 地 完成 一 个 长 度 为 3 的 列 
表 的 排序 ? 

(1, 3)(3, 2) 
(1, 2)(2, 3)(1, 2) 

, 注意 ， 通 过 这 种 方式 表示 交换 序列 ， 序 列 能 
够 侵入 后 继 序 列 ， 然 后 重新 结合 形成 新 的 序 
列 。 使 用 该 方法 ， 描 述 一 种 遗传 算法 ， 用 于 
开发 一 个 为 长 度 为 10 的 列表 排序 的 程序 。 

假定 一 组 机 器 人 的 每 个 成 员 都 配备 有 一 对 传 

感 器 ， 每 个 传感器 都 能 探测 到 正 前 方 2m 范 围 

的 物体 。 每 个 机 器 人 的 形状 都 像 一 个 废物 简 ， 

能 在 任何 方向 移动 。 试 设计 一 系列 实验 ,用 来 

确定 传 感 回 闭 在 哪里 , 使 得 造就 的 机 器 人 能 成 

功 地 将 一 个 篮球 直线 抛 出 。 你 的 一 系列 实验 如 

何 与 一 个 进化 系统 相 比 较 ? 

你 做 出 某 种 决定 是 基于 反应 模式 还 是 基于 计 

划 模 式 ? 你 的 回答 是 否 依 赖 于 你 是 决定 中 午 

吃 什 么 还 是 作出 求职 决定 ? 


司 


To 本 呈 Ca -二 下 二 是 


下 和 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问 题 。 回 答 这 些 问 题 不 

征 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回 答 ， 以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 

1. 核能 、 基 因 工 程 以 及 人 工 智 能 领域 的 研究 者 对 于 他 们 工作 成 果 的 利用 方式 应 在 多 大 程度 
上 和 负 有 责任 ? 科学 家 对 其 研究 揭示 的 知识 是 否 负 有 责任 ? 若 因此 产生 了 意 想不到 的 后 


果 ， 怎 么 办 ? 


2. 怎样 区 分 智能 和 模拟 的 智能 ? 你 认为 二 者 有 区 别 吗 ? 

3. 假定 一 个 计算 机 化 的 专家 系统 因 其 给 出 好 的 建议 而 在 医疗 界 享有 盛誉 。 作 为 一 个 医生 ， 
在 多 大 程度 上 可 以 让 这 个 系统 代替 他 《〈 她 ) 为 病人 作出 治疗 决定 。 如 果 医 生 的 治疗 方案 
与 专家 系统 所 提 的 治疗 方案 相对 立 ， 并 且 后 来 证 实 专家 系统 是 正确 的 ， 那 么 那个 医生 是 
否 应 该 对 其 不 当 治 疗 负 有 责任 ? 一 般 说 来 ， 如 果 一 个 专家 系统 在 某 个 领域 内 很 有 名 ， 那 
么 在 多 大 程度 上 它 会 束缚 而 不 是 提高 人 类 专家 的 判断 力 ? 

4. 许多 人 认为 计算 机 的 行为 只 不 过 是 人 对 它 怎样 编程 的 结果 ， 所 以 计算 机 不 可 能 有 自主 意 
志 。 从 而 ， 计 算 机 也 不 应 对 它 的 行为 负责 。 人 脑 是 计算 机 吗 ? 人 是 否 在 出 生 的 时 候 就 事 
先 被 编程 好 了 ? 人 是 否 被 他 所 处 的 环境 编程 ? 人 是 否 要 对 自己 的 行为 负责 ? 
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第 11 章 人 工 智 能 


. 征 否 有 这 样 一 些 手段 ， 科 学 即使 能 够 去 做 ， 也 不 应 当 去 做 ? 例如 ， 如 果 有 朝 一 日 可 以 


造 出 具备 能 与 人 类 相 比 拟 的 感知 和 推理 能 力 的 机 器 ， 那 么 建造 这 样 的 机 器 是 否 恰 当 ? 
这 样 的 机 器 的 出 现 会 带 来 什么 样 的 问题 ? 今天 其 他 一 些 科 学 领域 的 进展 正在 引发 哪些 
问题 ? 


. 历史 上 有 许多 例子 表明 ， 科 学 家 、 艺 术 家 的 创作 活动 受 其 所 处 时 代 的 政治 、 宗 教 及 其 他 


社会 势力 的 影响 。 这 样 的 一 些 因素 以 何 种 方式 影响 着 当今 的 科学 成 就 ? 特别 在 计算 机 科 
学 领域 情况 如 何 ? 


当今， 技术 的 进展 造成 了 一 些 人 的 工作 成 为 多 余 ， 许 多 文化 至 少 应 担负 起 一 定 的 责任 来 


帮助 对 这 些 人 进行 再 教育 。 随 着 技术 使 我 们 越 来 越 多 的 能 力 成 为 多 余 ， 社 会 应 当 或 能 够 
做 些 什 么 ? 


. 假定 你 收 到 一 张 计算 机 处 理 的 费用 为 $0.00 的 账单 。 你 该 怎么 办 ? 假定 你 置之不理 ，30 


天 后 你 义 收 到 第 二 张 $0.00 的 催 款 通知 单 ， 你 该 怎么 办 ? 假定 你 依然 不 理 晕 , 而 30 天 后 你 
叉 收 到 了 一 张 $0.00 的 催 款 通知 单 ， 而 且 还 有 提示 ， 若 不 及 时 付款 ， 将 诉 诸 法 律 。 谁 将 对 
此 负责 ? 


. 契 否 有 这 样 的 情况 ， 你 会 把 个 性 与 个 人 电脑 联系 在 一 起 ? 你 的 计算 机 好 像 在 施行 报复 或 


者 固执 难 缠 ? 你 对 你 的 计算 机 恼火 生气 过 吗 ? 对 你 的 计算 机 恼火 和 对 计算 机 所 做 的 结 
宁 恼 火 有 什么 不 同 ? 你 的 计算 机 和 你 生 过 气 吗 ?你 与 别 的 东西 ， 如 汽车 、 电 视 机 、 圆 珠 
笔 ， 有 过 类 似 的 关系 吗 ? 

根据 你 对 上 面 问题 的 回答 ， 人 在 多 大 程度 上 会 把 一 个 实体 的 行为 与 智能 和 意识 的 存在 
联系 起 来 ? 在 多 大 程度 上 ， 人 应 当做 这 样 的 关联 ? 对 于 一 个 智能 实体 来 说 ， 是 否 可 能 
用 有 别 于 其 他 行为 的 方式 来 展现 它 的 智能 ? 


. 许多 人 觉得， 能 通过 图 灵 测 试 并 不 意味 着 机 器 有 智能 。 一 个 论点 是 ， 智 能 的 行为 本 身 


并 不 意味 智能 。 而 进化 论 的 基础 是 适 者 生存 ， 这 就 是 一 种 基于 行为 的 测试 。 是 理 进 化 
论 意味 着 智能 行为 是 智能 的 前 身 ? 机 器 能 通过 图 灵 测 试 ， 是 否 意味 着 它们 正在 变 成 有 
智能 ? 

医疗 手段 已 经 取得 了 很 大 的 进步 ， 人 体 的 许多 器 官 现在 都 能 用 人 造 器 官 或 者 捐赠 人 的 
获 官 来 丛 代 。 可 以 设想 ， 终 究 有 一 天 连 大 脑 也 能 换 。 如 果 这 样 的 事 能 够 做 到 ， 会 产生 
什么 样 的 道德 问题 ? 如 果 一 个 病人 的 神经 细胞 被 人 造 神经 细胞 一 点 点 换 掉 ， 那 个 病人 
还 是 同一 个 人 吗 ? 那 个 病人 会 觉察 到 有 什么 不 同 吗 ? 那个 病人 还 算 人 吗 ? 
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第 上书 这 
计算 理论 


章 将 讨论 计算 机 科学 的 理论 基础 。 在 某 种 意义 上 说 ， 本 章 所 讨论 的 基本 内 容 为 计算 
机 科学 丙 定 了 其 真正 的 学 科 地 位 。 尽 管 本 质 上 有 些 抽 象 ， 但 该 知识 的 主体 部 分 已 经 
有 许多 非常 实际 的 应 用 。 有 具体 来 说 ， 我 们 将 讨论 有 关 编 程 语言 能 力 的 内 在 问题 ， 以 及 如 何 通过 
它 来 构建 广泛 用 于 因特网 通信 中 的 公 钥 密码 系统 。 
本 章 要 讨论 的 是 有 关 计 算 机 能 做 什么 以 及 不 能 做 什么 的 问题 。 我 们 将 看 到 ， 一 种 称 为 图 灵 
机 的 简单 机 器 如 何 被 用 来 确定 机 器 可 解 问题 与 机 器 不 可 解 问题 之 间 的 界线 。 我 们 还 将 确定 一 个 
特定 的 问题 ， 就 是 停机 问题 ， 这 个 问题 的 解决 超出 了 算法 系统 的 能 力 ， 所 以 也 就 超出 了 当今 乃 
全 未 来 计算 机 的 能 力 。 而 且 ， 我 们 会 发 现 ， 即 使 在 机 器 可 解 的 问题 中 ， 仍 然 存在 一 些 复杂 的 问 
题 ， 从 任何 实际 的 观点 来 看 还 是 不 可 解 的 。 最 后 要 讨论 的 是 ， 复 杂 性 领域 内 的 知识 如 何 被 用 来 
构建 公 钥 密码 系统 。 


ni 二 国 -0 和 再 生生 ra 可 





本 章 的 目的 在 于 研究 计算 机 的 能 力 。 我 们 要 理解 机 器 能 做 什么 和 不 能 做 什么 ， 以 及 机 器 要 
实现 其 全 部 潜能 需要 哪些 特征 。 这 里 ， 就 从 计算 函数 的 概念 开始 进行 讨论 。 

从 数学 意义 上 讲 ， 函 数 〈function) 是 一 组 可 能 的 输入 值 和 一 组 可 能 的 输出 值 之 问 的 映射 关 
系 ， 它 使 每 个 可 能 的 输入 被 赋予 单一 的 输出 。 函 数 的 一 个 例子 是 ， 将 以 码 为 度量 单位 转化 为 以 
米 为 度量 单位 。 如 果 是 同样 的 距离 ， 每 次 用 码 作为 单位 度量 与 用 米 作 为 单位 度量 的 结果 之 间 存 
在 着 对 应 关系 。 另 外 一 个 例子 ， 我 们 称 之 为 排序 函数 ， 该 函数 对 每 个 输入 的 数值 表 都 距 予 了 一- 
个 输出 表 ， 而 输出 表 的 数据 项 与 输入 表 一 样 ， 但 是 按照 升序 排列 的 。 还 有 一 个 例子 就 是 加 法 函 
数 ， 该 函数 的 输入 是 一 对 数值 ， 而 输出 值 代表 的 是 每 对 输入 值 之 和 。 

对 于 一 个 给 定 的 输入 ， 确 定 其 具体 的 输出 值 ， 这 样 一 个 过 程 称 之 为 函数 的 计算 。 对 函数 进 
行 计 算 的 能 力 非常 重要 ， 这 是 因为 正 是 通过 对 函数 的 计算 ， 问 题 才能 得 到 解决 。 为 了 解决 一 个 
加 法 问题 ， 就 必须 计算 加 法 函数 ， 为 了 对 表 进 行 排序 ， 则 必须 计算 一 个 排序 函数 。 因 此 ， 计 算 
机 科学 的 一 个 基本 问题 就 是 要 找到 一 种 技术 ， 并 用 其 来 计算 用 于 求解 问题 的 函数 。 


递归 函数 理论 2 
没有 什么 比 被 告知 一 些 不 能 做 的 事 更 能 名 起 人 的 本 性 .一旦 研究 人 员 开 始 确定 一 些 丰 可 
解 的 问题 ， 从 某 种 意义 上 讲 ， 就 是 找 不 到 解决 问题 的 算法 ， 就 会 有 另外 一 些 大 开始 研究 这 类 
问题 ， 并 芝 试 着 理解 问题 的 复杂 性 。 今天， 这 个 领域 的 研究 成 为 了 递归 通 数 理论 学 科 的 主要 
内 容 ， 并 且 ， 很 多 人 已 经 认识 到 了 这 种 超 难 问题 。 事实 上 ， 正 如 数学 家 开发 出 数字 系统 来 揭 
示 无 限 空间 上 的 “定量 ”标准 一 样 ， 递 归 函 数理 论 学 家 也 揭 开 了 问题 空间 内 的 多 级 复杂 性 ， 
这 些 问 题 已 经 超出 了 站 法 的 能 
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例如 ， 考 虑 下 面 这样 一 个 系统 ， 其 中 ， 一 个 函数 的 输入 和 输出 能 预先 确定 ， 并 记录 在 一 个 
表 中 。 每 当 需 要 函数 的 输出 时 ， 我 们 只 需 查找 表 中 的 给 定 输入 ， 就 能 找到 所 要 的 输出 。 这 样 一 
来 ， 这 个 函数 的 计算 就 简化 为 表 的 查找 过 程 。 这 样 的 系统 比较 方便 ， 但 功能 有 限 ， 这 是 因为 许 
多 图 数 不 可 能 完全 表 丰 成 表格 形式 。 如 图 12-1 所 示 的 例子 ， 例 中 试图 显示 将 码 作为 量度 单位 转 
化 为 等 价 的 用 米 作为 量度 的 函数 。 因 为 没有 对 可 能 的 输入 /输出 对 的 表 进 行 限制 ， 所 以 这 个 表 注 
定 是 不 宛 整 的 。 


码 米 

(输入 ) 【输出 ) 
0.9144 
.和 志 半生 
册 . 了 下 汪 直 
3. 量 5 7 
双 ., 写 7 过 


图 12-1 坚 示 将 公 量 度 转 化 为 米 量度 的 函数 的 党 试 


计算 函数 的 一 个 比较 有 效 的 方法 是 遵循 代数 公式 所 提供 的 方向 ， 而 不 是 试图 将 所 有 可 能 的 
答 入 / 答 出 组 合 显示 在 表 中 。 例 如 ， 可 以 用 代数 公式 


Y= 己 《14+r) 


来 描述 怎样 计算 一 个 投资 额 为 已 (年 复 利 率 为 r) mn 年 后 的 金额 。 

但 是 ， 代 数 公式 的 表达 能 力也 有 它 的 局 限 性 。 有 些 函 数 ， 它 的 输入 /输出 关系 太 过 复杂 ， 以 
伍 于 不 能 用 代数 运算 来 描述 。 这 样 的 例子 包括 三 角 函 数 ， 如 正弦 和 余弦 函数 等 。 如 果 要 计算 38。 
的 正弦 值 ， 则 可 能 会 画 出 相应 的 三 角形 ， 测 出 它 的 边 长 ， 然 后 计算 所 要 求 的 比率 ， 而 这 样 的 一 
个 过 程 就 不 能 表示 为 对 数值 38 的 代数 运算 。 用 袖珍 计算 机 来 计算 38" 的 正弦 也 是 比较 费劲 的 。 
实际 上 ， 对 38 ”的 正弦 值 而 言 ， 必 须 利 用 较 复 杂 的 数学 技术 来 得 到 一 个 非常 好 的 近似 值 ， 并 将 
此 作为 答案 。 

于 是 ， 可 以 看 出 ， 当 考虑 的 函数 越 来 越 复杂 时 ， 我 们 不 得 不 应 用 功能 更 为 强大 的 技术 来 计 
算 它 们 。 然 而 ， 问 题 在 于 不 管 函数 的 复杂 性 如 何 ， 我 们 是 否 总 能 找到 一 个 系统 来 计算 它们 ? 答 
案 是 否定 的 。 一 个 令 人 难受 的 数学 结论 是 ， 存 在 这 样 的 一 些 函 数 ， 它 们 过 于 复杂 以 致 于 找 不 到 
定义 好 的 、 一 步 一 步 的 过 程 来 根据 输入 值 确定 其 输出 值 。 结 果 ， 这 些 函 数 的 计算 就 超出 了 任何 
算法 系统 的 能 力 范围 。 那 么 ， 这 样 的 函数 就 称 为 不 可 计算 的 ， 而 有 些 函 数 ， 如 果 可 以 依据 它们 
的 输入 值 ， 通 过 算法 来 确定 其 输出 值 ， 就 称 其 为 可 计算 的 〈computable )。 

企 计 算 机 科学 中 ， 可 计算 函数 与 不 可 计算 函数 之 间 的 区 别 很 重要 。 这 是 因为 ， 机 器 只 能 按照 
所 描述 的 算法 来 完成 任务 ， 所 以 可 计算 函数 的 研究 最 终 是 对 机 器 能 力 的 研究 。 如 果 我 们 能 够 确定 
这 桩 的 能 力 ， 即 允许 机 器 能 计算 整 组 的 可 计算 函数 ， 于 是 就 可 以 造 出 具有 这 些 能 力 的 机 器 ， 那 么 
了 束 可 以 确信 ， 所 建造 的 机 器 的 功能 就 如 我 们 所 能 够 建造 的 那么 大 。 同 样 ， 如 果 发 现 一 个 问题 的 解 
决 笛 要 计算 一 个 不 可 计算 函数 , 那么 可 以 得 出 这 样 的 结论 : 该 问题 的 求解 超出 了 机 器 的 能 力 范围 。 


问题 与 练习 
1 举 出 一 些 函数 ， 要 求 它们 能 完全 由 表格 形式 表示 。 
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2. 举 出 一 些 函数 ， 要 求 其 输出 可 以 描述 为 包括 其 输入 的 一 个 代数 表达 式 。 

3 举 出 一 个 函数 ， 要 求 不 能 用 代数 公式 来 播 述 。 那 么 你 的 这 个 函数 是 否 仍然 为 可 计算 的 ? 

4 古 希 腊 数 学 家 用 真 尺 和 圆规 夯 形 状 。 他 们 开发 出 一 些 方法 ， 用 来 找 一 条 直线 的 中 点 ， 构 建 一 个 直角 ， 
以 及 画 一 个 等 边 三 角形 。 然 而 ， 他 们 的 “计算 系统 ”不 能 完成 的 “计算 ”是 什么 ? 


ET Te 1 Te Rn 


局 二 

E 

这 避 际 ， 
Re 


企 理解 机 器 的 能 力 以 及 它 的 局 限 性 的 工作 中 ， 许 多 研究 人 员 已 经 提出 并 研究 了 各 种 不 同 的 
计算 设备 。 其 中 之 一 就 是 图 灵机 ， 它 是 由 图 灵 于 1936 年 提出 来 的 ， 而 在 今天 ， 它 仍然 被 用 作 研 
558| ” 究 算 法 处 理 能 力 的 一 种 工具 。 


12.2.1 图 灵机 原理 


图 灵机 〈Turing machine) 是 由 一 个 控制 单元 组 成 的 ， 它 能 够 通过 一 个 读 / 写 磁头 对 磁带 上 的 
符号 进行 读 和 写 〈 见 图 12-2)。 磁 带 两 端 可 以 无 限 延伸 ， 并 分 成 一 个 个 单元 ， 而 每 个 单元 可 以 所 
含 任意 一 个 有 限 组 符号 的 集合 ， 这 个 集合 称 为 机 器 的 字母 表 。 
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控 删 单元 





图 12-2 图 灵机 的 组 成 


在 图 灵机 计算 的 任何 一 时 刻 ， 机 器 -一定 处 在 有 限 个 条 件 中 的 一 个 ， 这 些 条 件 称 为 状态 。 图 
天 机 的 计算 开始 于 一 个 特定 的 状态 ， 称 为 初始 状态 ， 而 停止 于 另 一 特定 的 状态 ， 称 为 停止 状态 。 

图 机 的 计算 由 机 器 的 控制 单元 执行 的 一 系列 步骤 所 组 成 。 每 一 步 都 包括 观察 当前 磁带 单 
元 中 的 符号 〈 由 读 / 写 磁头 所 看 到 的 那个 )， 然 后 将 符号 写 进 这 个 单元 ， 期 间 可 能 要 将 读 / 写 磁头 
正 移 或 右 移 一 个 单元 ， 接 下 来 再 改变 状态 。 要 执行 的 确切 活动 是 由 程序 所 决定 的 ， 程 序 通过 机 
个 的 状态 和 磁带 当前 单元 的 内 容 来 告诉 控制 单元 做 什么 。 

现在 来 考虑 图 灵机 的 一 个 具体 的 例子 。 为 此 ， 将 机 器 的 磁带 表示 成 一 条 水 平 条 带 ， 并 将 条 
带 分 成 一 个 个 单元 ， 且 单元 中 可 以 记录 机 器 字母 表 里 的 符号 。 可 以 通过 在 磁带 当前 单元 放置 一 
个 标签 来 标示 机 器 的 读 / 写 磁头 的 当前 位 置 。 本 例 中 的 字母 包括 有 0、1 和 *。 机 噩 的 磁带 的 样子 


如 下 图 所 示 : 
| | 1。[ 柄 可 \ 


当前 位 置 


磁带 上 的 符号 串 可 以 解释 为 由 星 号 分 开 的 二 进 制 数 ， 那么 可 以 看 出 ， 这 个 具体 的 磁带 包含 的 
征 什 5。 我 们 所 设计 的 图 灵机 要 把 磁带 上 的 这 样 一 个 值 加 1 更 准确 地 说 ， 假 设 开始 位 置 是 标 在 一 

帅 0 和 1 右 端 的 星 号 ， 接 下 来 要 做 的 是 改变 其 左边 的 位 模式 ， 使 其 可 以 表示 下 一 个 较 大 的 整数 。 
我 们 机 器 的 状态 有 : sSTaRT (开始 )、appD〔〈 相 加 )、caRRY (进位 )、OVERFLOW 〔 溢 出 )、 
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RETURN 《返回 ) 以 及 HaALT (〈 停 止 )。 这 些 状 态 的 每 一 个 相应 的 活动 和 当前 单元 的 内 容 如 图 12-3 
中 的 表 所 示 。 这 里 假设 机 器 一 直 是 从 STRaAT 状 态 开 始 的 。 


当前 单 


当前 状态 元 内 窗 写 的 慎 移动 方向 进 六 的 新 状态 
START * - 汪 ADD 
ADD 0 1 RETURN 
ADD 1 0 下 各 CARRY 
ADD s s 3 HALT 
人 ARRY 0 大 移 RETURN 
CARRY 1 0 CARRY 
CARRY * 1 远 移 OVERFLOW/ 
OVERFLOW/ lgnored * RETURN 
RETURN 1 0 4 RETURN 
RETURNI 1: et RETURN 
RETURN > HAET 


图 12-3 ”实现 对 值 进 行 增加 操作 的 图 灵机 


现在 把 这 个 机 器 应 用 到 上 面 那个 图 示 的 包含 值 5 的 磁带 上 。 可 以 观察 到 ， 当 处 在 STRAT 状 态 
时 ， 当 前 单元 包含 *〈 在 本 例 中 )， 上 表 指 示 我 们 要 重 写 *， 并 将 读 / 写 磁头 左 移 一 个 单元 ， 这 时 
就 进入 了 ADD 状 态 。 做 完 这 些 后 ， 机 器 的 情况 就 如 下 图 所 示 : 


/| ， | 11" 国 几 .|、 
机 器 状态 =ADD 当前 位 置 


为 了 继续 ， 查 表 看 当 处 于 ADD 状 态 并 且 当 前 单元 包含 1 时 ， 机 器 要 做 些 什么 。 图 12-3 所 示 的 
表 告 诉 我 们 要 用 0 代替 当前 单元 的 1， 并 把 读 / 写 磁 头 左 移 一 个 单元 ， 这 时 就 进入 了 CRARRY 状 态 。 
这 样 一 来 ， 机 器 的 情况 就 如 下 图 所 示 : 


机 器 状态 =CaARRY 当前 位 置 


接 下 来 ， 我 们 再 去 查 表 ， 看 看 当 机 器 处 在 CARRY 状 态 并 且 当 前 单元 包含 0 时 要 做 什么 。 表 告 
诉 我 们 应 该 用 1 来 代替 0， 并 把 读 / 写 磁 头 右 移 一 个 单元 ， 这 时 就 进入 了 RETURN 状 态 。 做 完 这 些 
后 ， 机 器 的 情况 就 如 下 图 所 示 ; 


/| ，| 1 | 1 本国 *|、 


机 器 状态 =RETURN 当前 位 置 


根据 这 个 情况 , 表 指 示 我 们 用 另 一 个 0 来 代替 当前 单元 中 的 0, 并 把 读 / 写 磁头 右 移 一 个 单元 ， 
这 时 就 保持 在 RETURN 状 态 。 结 果 ， 机 器 的 情况 就 如 下 图 所 示 ; 


/| "| 1 11 辆 几 、 


机 器 状态 =RETURN 当前 位 置 


[5650 
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在 这 个 时 候 ， 可 以 看 到 ， 表 指示 我 们 在 当前 单元 中 重 写 *， 同 时 进入 HALm 状 态 。 于 古 ， 机 
器 吉 停 止 在 如 下 的 情况 〈 磁 带 上 的 符号 就 表示 了 所 需要 的 值 6)， 


| "| 1 | 1 Lo、 


机 器 状态 =HaALT 当前 位 置 


图 灵机 的 起 源 

20 世 纪 30 年 代 ， 于 在 技术 能 够 提供 我 们 现在 所 知道 的 机 器 之 前 ， 阿 兰 . 图 灵 就 提出 了 图 
爱 机 的 概念 。 事 实 上 ,图 灵 所 想 的 是 人 用 铝 笔 和 纸 来 进行 计算 图 头 的 目的 是 提供 一 个 模型 ， 
并 且 利用 这 个 模型 来 研究 “计算 过 程 ”的 局 限 性 。 在 此 前 不 久 ，1931 年 哥 德 尔 ( G6del) 发 表 
了 着 名 的 揭示 计算 系统 局 限 性 的 论文 ， 并 且 其 研究 的 主要 精力 集中 在 理解 这 些 局 限 性 上 .在 
图 爱 提 出 他 的 模型 的 同一 年 ( 1936 年 ),， 埃 米 尔 .波斯 特 ( Emil Post ) 提出 了 另外 一 种 模型 ( 现 
在 将 其 称 为 波斯 特产 生 式 系统 )， 他 所 提出 的 这 个 模型 与 图 灵 的 模型 有 着 同样 的 能 力 . 作为 这 
些 个 期 研究 人 员 洞 察 力 的 见证 ， 他 们 的 计算 系统 模型 (如 图 关机 和 波斯 特产 生 式 系统 等 ) 在 
计算 机 科学 研究 领域 ， 仍然 可 以 作为 有 价值 的 工具 来 使 用 。 


1<.2.2 匡 奇 -图 灵 论 题 


前 面 例子 中 的 图 灵机 可 以 用 来 计算 所 谓 的 后 继 函 数 ， 这 种 函数 对 每 个 非 负 刺 数 输入 值 m 赋 了 予 
了 输出 值 m+1。 我 们 只 需要 把 用 二 进 制 形式 表示 的 输入 值 放 在 机 器 的 磁带 上 ， 运行 机 器 ,直至 停 
止 ， 然 后 就 可 以 从 磁带 上 读 取 输 出 值 。 这 种 由 图 灵机 以 这 种 方式 计算 的 函数 称 为 图 灵 可 计算 的 
(Turing computable )。 
图 天 猜想 是 指 : 图 灵 可 计算 函数 与 可 计算 函数 是 一 样 的 。 换 名 话说， 图 灵 猜 想 ， 图 灵机 的 
中 鼻 能 力 囊 括 了 任何 算法 系统 的 能 力 ,或 者 同样 也 可 以 这 和 说 ， (与 表格 和 代数 公式 这 些 方法 形 
成 对 比 ) 图 灵机 概念 提供 了 一 个 环境 ， 在 此 环境 下 ， 所 有 可 计算 函数 的 解 都 能 够 被 表示 。 在 今 
天 ， 这 个 猜想 通常 会 被 称 为 丘 奇 -图 灵 论 题 (Church-Turing thesis)， 这 是 为 了 纪念 阿兰 , 图 灵 和 

561| 阿 龙 审 ' 丘 奇 这 两 个 人 的 贡献 。 自 从 图 灵 的 最 初 工 作 以 来 ， 己 经 收集 了 许多 支持 这 个 论题 的 例 

证 ， 现 在 ， 丘 奇 -图 灵 论 题 已 经 被 广泛 接受 了 。 也 就 是 说 ， 可 计算 函数 与 图 灵 可 计算 函数 被 认为 
是 一 回 事 。 

这 个 猜想 的 意义 就 在 于 ， 它 领 情 到 了 计算 机 器 的 能 力 和 局 限 性 。 更 为 准确 地 说 ， 它 把 图 灵 
机 的 能 力 确立 为 一 种 标准 ， 因而 其 他 计算 系统 就 能 够 以 此 进行 比较 。 如 果 一 个 计算 系统 能 够 计 
算 所 有 的 图 灵 可 计算 函数 ， 那么 就 可 以 认为 它 的 能 力 与 任何 计算 系统 的 能 力 相当 。 


问题 与 练习 
1 应 用 本 节 所 描述 的 图 灵机 《 见 图 12-3) ， 从 如 下 的 初始 状态 开始 ， 


机 器 状态 =START 当前 位 置 


2 朱 述 一 个 图 灵机 ， 要 求 用 一 个 0 来 替换 一 串 0 和 1 
3 描述 一 个 图 灵机 ， 其 要 求 是 ， 如 果 磁 带 上 的 值 大 于 0， 则 该 值 要 减 1， 如 果 磁 带 上 的 值 为 0， 则 该 值 保持 
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不 变 。 
4. 请 华 出 一 个 日 章 生 活 的 场景 ,要求 该 场景 中 要 有 计算 的 活动 发 生 。 这 个 场景 怎样 与 图 灵机 进行 类 比 ? 
5， 描述 一 个 几 元 机， 要 求 它 在 某 些 输入 时 最 终 会 停机 ， 而 在 其 他 输入 时 永 不 会 停机 。 


12.3 ”通用 程序 设计 语言 


在 第 6 章 中 , 我 们 讨论 了 高 级 程序 设计 语言 中 的 各 种 特性 。 本 节 中 ,我 们 要 应 用 可 计算 性 方 
面 的 知识 来 确定 这 些 特性 中 哪些 特性 是 真正 必需 的 。 我 们 会 发 现 ， 当 今 的 高 级 语言 中 的 许多 特 
性 仅仅 是 增强 使 用 的 方便 性 ， 而 对 语言 的 基本 功能 并 没有 什么 贡献 。 

我 们 的 方法 是 描述 一 种 简单 的 指令 性 程序 设计 语言 ， 而 这 种 丰富 的 语言 足以 用 来 表达 计算 
所 有 图 灵 可 计算 机 数 〈 因 此 也 包括 所 有 可 计算 函数 ) 的 程序 。 因 此 ， 如 果 以 后 的 程序 员 发 现 一 
个 用 这 种 语言 解决 不 了 的 问题 ， 那 么 其 原因 并 不 在 于 这 种 语言 的 缺陷 ， 相 反 ， 问 题 就 出 在 没有 
解 次 这 个 问题 的 算法 。 具 有 这 种 性 质 的 程序 设计 语言 称 为 通用 程序 设计 语言 〈universal 
programmijng language )。 

你 也 许 会 惊奇 地 发 现 ， 一 种 通用 程序 设计 语言 其 实 并 不 需要 很 复杂 。 事 实 上 ， 我 们 所 需要 
的 这 种 语言 将 会 非常 简单 。 因 为 它 是 从 通用 程序 设计 语言 中 分 离 出 来 的 需求 的 最 小 集合 ， 所 以 
将 它 称 为 Bare Bones〈 基 本 要 素 ) 语言 。 


12.3.1 Bare Bones 语言 


为 了 表述 Bare Bones 语 言 ， 这 里 就 先 来 考虑 其 他 程序 设计 语言 中 的 声明 语句 。 尽 管 机 器 本 
里 只 能 处 理 二 进 制 位 模式 ， 并 且 不 知道 模式 所 代表 的 任何 知识 ， 但 是 这 些 声 明 语 名 使 程序 员 可 
以 从 数据 结构 和 数据 类 型 〈 如 数值 数组 和 字符 串 等 ) 方面 轻松 地 考虑 问题 。 用 来 处 理 精 巧 的 数 
据 类 型 和 数据 结构 的 高 级 指令 在 提交 给 机 器 执行 之 前 ， 必 须 被 翻译 成 机 器 级 的 指令 ， 这 些 指令 
操 织 位 模式 来 模拟 所 需 的 动作 。 

为 了 方便 ， 可 以 将 这 些 位 模式 解释 成 二 进 制 符号 表示 的 数值 。 这 样 一 来 ， 由 计算 机 完成 的 
所 有 计算 都 能 够 表示 成 包括 非 负 整数 的 数值 计算 ， 这 是 有 目 共 睛 的 。 而 且 ， 如 果 要 求 程序 员 按 
这 种 方式 表示 算法 ， 那 么 程序 设计 语言 就 能 得 到 简化 《〈 尽 管 这 会 增加 程序 员 的 负担 )。 

由 于 我 们 开发 Bare Bones 语 言 的 目标 是 开发 出 最 简单 的 语言 ， 所 以 我 们 将 遵循 这 个 思路 。 
Bare Bones 语 言 中 的 所 有 变量 都 考虑 表示 成 位 模式 ， 为 了 方便 ， 我 们 将 其 解释 为 二 进 制 符号 表 
示 的 非 负 整 数 。 这 样 一 来 ， 一 个 当前 赋值 为 模式 10 的 变量 将 包含 值 2， 而 赋值 为 模式 101 的 变量 
将 包含 值 $。 

利用 这 种 约定 ，Bare Bones 程 序 中 的 所 有 变量 都 属于 同一 种 类 型 ， 这 样 一 来 ， 这 种 语言 就 
不 需要 声明 语句 来 描述 不 同 变量 的 名 字 和 与 之 相应 属性 。 当 利用 Bare Bones 语 言 时 ， 程 序 员 可 
以 在 需要 时 只 要 使 用 一 个 新 变量 名 即 可 ， 这 里 ， 程 序 员 理 解 的 是 ， 它 是 -一 个 由 非 负 整 数 解释 的 
二 讲 制 模式 。 

当然 ， 用 在 Bare Bones 语 言 中 的 翻译 器 必须 能 够 把 变量 名 和 其 他 术语 区 分 开 来 。 要 做 到 这 
一 点 ， 希 要 设计 出 Bare Bones 语 言 的 语法 ， 以 便 只 需 通过 语法 就 可 以 识别 出 任何 术语 的 作用 。 
为 了 达到 这 个 目的 ， 我 们 规定 ;变量 名 必须 以 英文 字母 开头 ， 后 面 可 以 跟 字 母 和 数字 〔0=-9) 
的 任意 组 合 。 这样 一 来 ， 字 符 串 XYZ、B747、 abcaefghi 以 及 X5Y 都 能 用 作 变 量 名 ， 而 2G5。、s$o 
和 x.Yy 就 不 能 。 

现在 ， 让 我 们 来 考虑 Bare Bones 语 言 中 的 过 程 语句 。 这 里 有 三 个 赋值 语句 和 一 个 表示 循环 
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的 控制 结构 语句 。 该 语言 是 一 种 自由 格式 的 语言 ， 于 是 每 条 语句 都 以 分 号 结束 ， 使 得 翻译 器 很 
容易 将 出 现在 同一 行 里 的 语句 分 割 开 。 然 而 ， 为 了 增强 可 读 性 ， 这 里 仍 采 用 的 是 每 行 只 写 - 一 条 
语句 的 原则 。 

三 条 赋值 语句 ， 每 条 都 要 求 改变 语句 中 所 标识 的 变量 的 内 容 。 第 一 条 语句 可 以 让 一 个 变量 


己 二 全 电工 五 喜人 和 白 ; 


其 中 name 可 以 是 任何 变量 名 。 
另外 两 条 赋值 语句 的 作用 本 质 上 是 相反 的 ; 


并 记 冯 蕊 万 号 用 尼 ， 


四 已 CT 。 矶 号 抽 已 ; 


同样 ，name 表 示 任 何 变量 名 。 第 一 条 语句 使 得 标识 的 变量 所 关联 的 值 增加 1。 这 样 一 来 ， 如 果 
变量 Y 原 先 赋值 为 5， 那 么 执行 语句 


工 CEI 芋 ; 


后 ， 赋 给 变量 Y 的 值 就 变 为 6。 
相反 ，daecr 语 句 被 用 来 将 标识 的 变量 所 关联 的 值 减 1。 一 种 例外 的 情况 是 ， 当 变量 的 值 已 
经 为 0 时 ， 这 条 语句 将 保持 值 不 变 。 所 以 ， 如 果 与 变量 Y 关 联 的 值 为 5， 那 么 执行 语 向 


加 后 C 荆 工 ; 


后 ， 变 量 Y 所 赋 的 值 就 为 4。 然 而 ， 如 果 变 量 Y 的 值 已 经 为 0， 那 么 执行 这 条 语句 后 ， 该 变量 的 值 
仍 为 0。 
Bare Bones 语 言 只 提供 了 一 条 控制 结构 语句 ， 该 语句 由 while-end 语 句 对 表示 。 语 句 序列 


while name Pot 0 c; 


登记 ， 


《其 中 的 name 表 示 任 何 变量 名 ) 使 得 只 要 在 变量 name 不 为 0 的 情况 下 ， 位 于 while 与 end 之 间 的 
任何 语句 或 语句 序列 都 将 反复 执行 。 更 为 准确 地 说 ， 当 在 程序 执行 期 间 遇 到 while-ena 结 构 语 
句 时， 所 标识 变量 的 值 首先 和 0 进行 比较 : 如 果 值 为 0， 则 跳 过 此 结构 ， 继 续 执 行 end 后 面 的 语 
句 ; 然而 , 如 果 变 量 的 值 不 为 0, 那么 就 执行 while-enq 结 构 中 的 语句 序列 , 并 且 控 制 回 到 while 
语句 ， 于 是 再 进行 比较 。 注 意 ， 程 序 员 要 担 起 循环 控制 的 一 部 分 责任 ， 为 了 避免 无 限制 的 循环 ， 
程序 员 必 须 在 循环 体 中 明确 要 求 改变 变量 的 值 。 例 如 ， 语 句 序列 


工 mcCr 时 ; 

while To 0 dc 
1LDCF 也 3 

已 也 口 ; 


将 会 导致 一个 无 穷 的 循环 过 程 ， 这 是 因为 一 旦 到 达 while 语 句 ，x 的 值 永远 不 会 为 0。 而 语句 序列 


安 ] 忆 电工 己 ; 
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whILJe X no 0 dc; 
1met 马 ; 
休息 它 王 其 

全 mQ; 


最 终 会 停止 。 该 语句 的 作用 是 将 X 的 初始 值 转移 给 变量 z。 

可 以 观察 出 ，while 和 end 语 句 必须 成 对 出 现 ， 且 while 语 名 在 前 。 然 而 ，while-enq 语 名 
对 也 可 以 出 现在 被 另 一 个 while-end 语 句 对 重复 执行 的 结构 中 。 在 这 种 情况 中 ，while 和 ena 
语句 配对 是 这 样 实现 的 ， 即 先 按 程序 的 编写 形式 从 头 到 尾 的 对 程序 进行 扫描 ， 并 将 每 条 sna 语 
名 与 其 最 近 的 、 还 没有 配对 的 前 面 一 条 while 语 句 关联 成 一 对 。 虽 然 在 语法 上 并 非 必需 的 ， 我 
们 还 是 通常 采用 缩 进 的 形式 来 增加 这 种 结构 的 可 读 性 。 

最 后 一 个 例子 是 图 12-4 中 的 指令 序列 ， 该 序列 执行 的 结果 是 将 X 和 Y 的 值 的 乘积 赋 给 z， 虽 然 
有 一 个 的 副作用 ， 即 会 破坏 已 经 赋值 给 xX 的 任何 非 零 值 。( 由 变量 w 控 制 的 while_-end 结 构 起 到 了 
恢复 Y 的 初始 值 的 作用 。) 


它 荆 忆 训 三 王 ， 
While 其 met DD ao; 
它 卫 宇 电 工 铺 ; 
While YY moet 昌 Di 
站 安生 世 ， 
工 mC 工 同 ; 
同人 CE 于 


尼 站 局 ; 
册 上 二 工 全 傅 玫 如上 站 电 襄 ; 
二 它 荆 于 
灯 己 它 匡 全 ， 
已 也 梧 ; 
朵 已 避 三 其， 
全 刀 梧 ; 





图 12-4 ”一 个 用 于 计算 xxY 的 Bare Bones 程 序 
12.3.2 用 Bare Bones 语言 编程 


记 住 ， 我 们 提出 Bare Bones 语 言 的 目的 就 是 要 研究 什么 是 可 能 的 ， 什 么 是 不 切实 际 的 。 如 
朱 放 在 实用 的 场合 使 用 Bare Bones 语 言 ， 事 实证 明 将 不 太 合适 。 另 一 方面 ， 我 们 将 很 快 看 到 ， 
这 种 简单 的 语言 达到 了 我 们 的 目的 ， 即 提供 了 一 个 基本 的 通用 程序 设计 语言 。 在 这 里 ， 我 们 只 
征 要 说 明 一 下 如 何 用 Bare Bones 语 言 来 表示 一 些 基 本 的 操作 。 
首先 可 以 注意 到 ， 运 用 几 个 赋值 语句 的 组 合 可 以 把 任何 值 (任何 非 负 整数 ) 赋 给 一 个 指定 
ah 例如 ， 以 下 语句 序列 用 来 实现 把 值 3 赋 给 变量 x， 即 先 将 值 0 赋 给 Xx， 然 后 对 其 值 进 行 三 
亿 则 操 作 : 


尼 荆 已 忆 工时 
ImcE 其 ; 
工 站 公开 雹 

了 五 世 工 天 

程序 中 另 一 种 常见 的 活动 就 是 将 数据 从 一 个 地 方 复制 到 另外 一 个 地 方 。 就 Bare Bones 语 言 
而 言 ， 这 就 意味 着 我 们 需要 能 够 将 一 个 变量 的 值 赋 给 另外 一 个 变量 。 可 以 这 样 来 做 到 ， 先 将 目 
标 变量 清 零 ， 然 后 对 其 进行 合适 次 数 的 递增 操作 。 事 实 上 ， 我 们 已 经 看 到 ， 语 名 序列 


所 了 已 包工 西 ; 
will]e 其 mot D ao; 
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主 这 安 基 加， 
加 Cr 其 


已 也 日 ; 


把 X 的 值 转移 到 了 z。 然 而 ， 这 个 语句 序列 还 有 一 个 副作用 ， 即 破坏 了 xX 的 初始 值 。 为 了 对 此 进 
行 校正 ， 可 以 引入 一 个 辅助 变量 ， 先 将 对 象 的 值 从 其 初始 位 置 转移 至 这 个 辅助 变量 。 于 是 ， 就 
可 以 将 这 个 辅助 变量 作为 数据 源 ， 并 从 中 恢复 初始 的 变量 ， 同 时 将 对 象 的 值 放 至 所 要 求 的 目的 
位 置 上 。 通 过 这 种 方式 ， 图 12-5 所 示 的 语句 序列 就 是 用 来 实现 了 Today 到 Yesterdav 的 转移 。 


二 已 电 工 站 UK 

安 】 忆 电 开 下 站 阅 站 瑟瑟 口 W ， 

We Todav mo 0 ao; 
主 e 贡 避 区， 


[| 

全 口 品 ; 

While 上 uX Dot 站 do; 
斌 刀 它 工 Ca; 
ImneCr DOmaoroOw，; 
问候 它 立 下 由 臣 ; 

让 已 忆 ; 


独 12-5 ”实现 指令 “copy today to tomorrow” 的 Bare Bones 语 句 序列 
我 们 采用 语法 


已 马 记 YY 万 忆 者 已 工 七 白石 喜 用 后 2 


《这 里 nameI 和 mame2 都 表示 变量 名 ) 作为 一 种 简略 的 符号 ， 用 来 表示 图 12-5 中 所 示 的 语句 结构 。 
这 样 一 来 ， 尽 管 Bare Bones 语 言 本 身 没 有 明确 的 copy 指 令 ， 但 是 在 写 程序 的 时 候 就 好 像 有 这 样 
的 指令 。 而 这 里 需要 理解 的 是 ， 要 将 这 种 非 正 式 的 程序 转化 成 实际 的 Bare Bones 语 言 程 序 ， 必 
须 把 copy 语 句 用 其 等 价 的 while-end 结 构 来 代替 , 并 且 所 使 用 的 辅助 变量 多 不 要 与 程序 中 其 他 
地 方 已 经 用 过 的 名 字 相 冲 帘 。 


12.3.3 Bare Bones 的 通用 性 


现在 山 应 用 丘 奇 - 图 灵 论 题 来 证 明 我 们 的 论断 , 即 Bare Bones 语 言 是 一 种 通用 程序 设计 语 计 。 
首先 ， 可 以 看 到 ， 任 何 用 Bare Bones 语 言 所 写 的 程序 都 能 看 作 是 对 一 个 函数 计算 的 指导 。 函 数 的 
和 葵 入 包含 的 是 程序 执行 前 赋予 变量 的 值 ， 并 且 函 数 的 输出 包含 的 是 程序 结束 时 变量 的 值 。 为 了 评 
算 这 个 国 数 ， 只 要 从 变量 的 适当 赋值 开始 执行 这 个 程序 ， 然 后 再 观察 程序 终止 时 变量 的 值 。 

在 这 些 条 件 下 ， 程 序 


ImeT 其; 


负责 计算 由 12.2 节 中 图 灵机 例子 所 计算 的 同一 个 函数 〈 后 继 函 数 )。 事 实 上 ， 它 将 x 的 值 增加 1。 
同 件 ， 如 采 将 变量 x 和 Y 解 释 成 输入 ， 而 将 变量 z 作 为 输出 ， 那 么 程序 


人 DBY 了 上 上 上马 芋 ; 





whille X no 0 aqo: 
mer 台 ; 
局 ecCr 其 ; 

华 刀 局 ; 


负责 加 法 函数 的 计算 。 
研究 者 已 经 证 明 ，Bare Bones 程 序 设计 语言 能 够 用 来 表示 计算 所 有 图 灵 可 计算 函数 的 算法 。 
如 采 把 这 与 丘 奇 -图 灵 论 题 相 结 合 ， 也 就 意味 着 任何 可 计算 函数 都 能 由 Bare Bones 语 言 编 写 的 程 
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序 来 进行 计算 。 这 样 一 来 ，Bare Bones 语 言 就 是 一 种 通用 程序 设计 语言 。 从 这 个 意义 上 讲 ， 如 
果 存 在 一 个 解决 问题 的 算法 ， 那 么 通过 一 些 Bare Bones 语 言 程 序 就 能 解决 这 个 问题 。 因 此 ， 理 
论 上 可 以 这 么 说 : Bare Bones 语 言 可 以 用 来 作为 一 种 通用 程序 设计 语言 。 


之 所 以 是 从 理论 上 讲 ， 是 因为 这 样 一 种 语言 当然 不 像 第 6 章 中 介绍 的 高 级 语言 那样 方便 。 


但 是 ， 每 种 高 级 语言 实质 上 都 包含 有 Bare Bones 语 言 的 特性 ， 并 将 其 作为 核心 。 实 际 上 ， 正 是 
这 个 核心 ， 才 保证 了 每 种 这 样 的 语言 的 通用 性 ， 而 各 种 语言 中 的 其 他 特性 都 是 为 了 使 用 的 方 
便 性 。 


尽管 像 Bare Bones 之 类 的 语言 在 应 用 程序 设计 环境 中 并 不 实用 ， 但 在 计算 机 科学 的 理论 赋 


究 中 还 是 能 找到 用 武之 地 的 。 例 如 ， 在 附录 E 中 ， 将 使 用 Bare Bones 语 言 作 为 一 种 工具 来 解决 第 
5 章 所 提出 关于 迭代 结构 和 递归 结构 等 价 的 问题 。 事 实 上 我 们 会 发 现 ， 这 种 等 价 性 的 猜测 证 明 是 
正确 的 。 


问题 与 练习 


L 


册 。 


了 


和 


< 


证 明 :， 语句 invert X; 〈 此 语句 的 功能 是 ， 如 果 X 的 初始 值 为 非 09， 那 么 就 把 X 的 值 转化 为 0; 如 果 包 

始 值 为 0， 那 么 就 将 该 值 转 化 为 1) 能 够 用 一 段 Bare Bones 程 序 段 来 进行 模拟 。 

证 明 : 即使 我 们 的 简单 Bare Bones 语 言 也 包 售 了 一 些 非 必要 的 语句 ， 如 clear 语句 能 利用 语言 中 席 的 

语句 的 组 合 来 代替 。 [568| 
证 明 ， ifE-then-else 结 构 能 够 由 Bare Bones 语 言 来 模拟 。 也 就 是 说 ， 用 Bare Bones 语 言 写 一 段 程序 

序列 ， 用 来 模拟 以 下 语句 的 活动 


E 训 忆 臣 站 七 所 全 瑟 马 1 直上 SB 呈 2 ; 


其 中 s1 和 82 表 示 的 是 任意 语句 序列 。 


. 证 有 明 :, 每 一 条 Bare Bones 语 句 都 能 用 附录 C 的 机 器 语言 来 表达 。 (所 以 Bare Bones 语 言 可 以 作为 这 杆 一 


种 机 器 的 编程 语言 。) 


. 趣 样 用 Bare Bones 语 言 来 处 理 负 数 ? 
.描述 由 下 列 Bare Bones 程 序 计算 的 函数 ， 恨 设 该 函数 的 输入 由 X 表 示 ， 输 出 由 2z 表 不 。 


人 上 上 忆 电 工 局 

Wii Te 其 DoE 日 世 避 ; 
LRCIE 了? 
ImCIE 己 ; 
可 丰产 天 其 


各 如 避 。 


RD 本 生肖 和 革 宙 才 肝 让 让 让 让 下 让 证 下- 让 
As 时 
% 日 
国 


现在 ， 我 们 来 指出 一 个 函数 ， 该 函数 属于 图 灵 不 可 计算 的 ， 因 此 ， 依 据 丘 奇 - 图 未 论题 ， 可 


以 完全 相信 它 在 一 般 意义 上 也 是 不 可 计算 的 。 这 样 一 来 ， 对 这 个 函数 的 计算 束 超 出 了 计算 机 的 
计算 能 力 。 


12.4.1 停机 问题 


我 们 要 讨论 的 是 与 这 个 不 可 计算 函数 相关 联 的 一 个 问题 , 即 停机 问题 Chalting proplem),( 简 


略 地 说 ) 这 个 问题 就 是 要 预先 预测 当 一 个 程序 在 某 些 条 件 下 开始 后 ， 是 否 能 够 终止 《或 者 说 是 
停止 )。 人 例如， 考虑 下 面 一 个 简单 的 Bare Bones 程 序 : 
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whlle X Poc 0 do 
1ner 其; 

尼 问 可 
如 采用 X 的 初始 值 为 0 来 执行 这 个 程序 ， 则 这 个 循环 体 将 不 会 执行 ， 并 且 程 序 很 快 就 可 以 终止。 
但 古 ， 如 果 用 X 的 任意 其 他 初始 值 来 执行 这 个 程序 ,那么 这 个 循环 将 会 永远 执行 下 去 ， 这 样 就 导 
致 了 一 个 不 可 终止 的 过 程 。 

于 征 ,， 在 这 种 情况 下 ， 就 不 难得 出 结论 : 只 有 当 X 的 初始 值 为 0 时 ， 该 程序 的 执行 才 会 终止 。 
然而 ， 如 果 考 虑 更 为 复杂 的 例子 ， 那么 对 程序 执行 行为 的 预测 任务 就 变 得 更 加 复杂 了 。 事 实 上 ， 
在 某 些 情 况 下 我 们 将 看 到 ， 这 种 预测 任务 几乎 不 可 能 完成 。 但 是 ， 我 们 首先 需要 做 的 是 规范 化 
术语 ， 并 使 想法 更 为 精确 。 

我 们 的 例子 已 经 表明 ， 一 个 程序 最 终 能 否 终 止 就 取决 于 其 变量 的 初始 值 。 这 样 一 来 ， 如 果 
我 们 想 预测 一 个 程序 的 执行 是 否 能 终止 ， 那 如 必须 在 考虑 这 些 初始 值 方面 要 做 到 比较 精确 。 为 
这 些 值 所 做 的 选择 粗 看 起 来 不 太 习 惯 ， 但 是 没有 关系 。 我 们 的 目标 是 利用 一 种 称 为 自 引用 
(self-reference) 的 技术 ， 其 思想 是 一 个 对 象 引 用 自己 。 从 “这 条 语句 是 错误 的 ” 这 样 的 句子 所 
表示 出 来 的 通俗 的 好 奇 心 ， 到 “所 有 集合 的 集合 是 否 包含 其 自身 ? ” 这 样 的 问题 所 表示 的 悖 论 ， 
这 种 手法 在 数学 上 已 经 多 次 导致 了 令 人 吃惊 的 结果 。 那 么 ， 我 们 所 要 做 的 就 是 建立 起 一 组 推理 
的 步骤 ， 而 这 些 步骤 就 类 似 于 “如 果 它 是 ， 那 么 它 就 不 是 ， 但 是 ， 如 果 它 不 是 ， 那么 它 觅 是 。” 

在 我 们 的 情况 中 ， 自 引用 是 这 样 来 实现 的 ， 即 给 程序 中 的 变量 赋 一 个 初 值 ， 而 这 个 值 就 表 
未 程序 本 身 。 为 此 ， 我 们 注意 到 ， 每 个 Bare Bones 程 序 都 是 利用 ASCII[ 码 ， 以 每 字 节 一 个 字符 的 
方 却 编码 成 一 个 单一 长 的 位 模式 ， 然 后 将 其 解释 为 一 个 〈《 相 当 大 ) 非 负 整数 的 二 进 制 表示 。 我 
们 赋 给 程序 中 变量 的 初始 值 正 是 这 个 整数 值 。 

现在 来 考虑 ， 如 果 在 下 面 这 个 简单 程序 的 情形 下 这 么 做 ， 会 有 什么 样 的 结果 ， 


while X not D ao; 
LeCE 其， 
Ts 有 


在 这 里 ， 我 们 想 知道 ， 如 果 程序 开始 的 时 候 X 赋 予 了 表示 程序 本 身 的 整数 值 〔 见 图 12.6)， 那么 
执行 程序 后 会 发 生 什么 情况 。 这 种 情况 下 ， 答 案 非常 明显 。 这 是 因为 x 将 会 是 一 个 非 零 值 ， 而 程 


序 就 因此 会 陷入 到 循环 中 ， 且 不 会 终止 。 另 一 方面 ， 如 果 用 下 面 的 程序 做 一 个 类 似 的 试验 ; 


利用 ASCH 码 
主刀 安 芷 筑 ， 出 S 位 Te 


全 中 本 ; 性 主权 上 了 二 了 日 二 各 证 自 站 站 。 ,有 于 于 让 他 二 自在 站 个 卫 二 开 有 注 证 





将 此 模式 赋值 给 X， 并 执行 程序 
图 12-6 ”测试 一 个 自 终 止 的 程序 


己 ] 局 忆 其; 
WwWhlle 区 meot 0 qdo，; 
LImCT 里; 
人 no ; 
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因为 不 论 初始 值 为 多 少 ， 当 执行 到 while-ena 结 构 时 ， 变 量 X 的 值 都 将 是 0， 这 样 程 序 就 会 
终止 。 

于 是 ,可 以 做 出 以 下 定义 : 如 果 程 序 中 所 有 的 变量 都 用 程序 自身 的 编码 表示 来 进行 初始 化 ， 
且 这 个 程序 的 执行 能 够 导致 一 个 终止 的 过 程 ， 那 么 这 个 Bare Bones 程 序 就 是 自 终 止 的 
(self-terminating)。 和 何 单 来 说 ， 如 果 一 个 程序 以 自身 作为 输入 开始 执行 县 能 终止 ， 那 么 这 个 程序 
就 是 目 终止 的 。 因 而 ， 这 就 是 我 们 所 期 望 的 自 引用 。 

可 以 注意 到 ， 一 个 程序 是 否 是 自 终 止 的 可 能 与 这 个 程序 的 编写 目的 无 关 。 它 仅仅 是 一 种 属 
性 ， 每 个 Bare Bones 程 序 要 么 具有 这 种 属性 ， 要 么 不 具有 这 种 属性 。 也 就 是 说 ， 每 个 Bare Bones 
程序 要 人 么 是 自 终 止 的 ， 要 么 就 不 是 。 

现在 ， 可 以 以 一 种 更 为 精确 的 方式 来 描述 停机 问题 。 这 个 问题 就 是 确定 Bare Bones 程 序 是 
目 终 止 的 ， 还 是 不 是 终止 的 。 我 们 将 要 看 到 ， 通 常 来 说 没有 回答 这 个 问题 的 算法 。 也 就 是 说 ， 
当 给 定 任何 一 个 Bare Bones 程 序 时 ， 没 有 一 个 单纯 的 算法 能 够 确定 这 个 程序 是 自 终 止 的 ， 还 是 
不 是 自 终 止 的 。 因 此 ， 停 机 问题 的 解 超出 了 计算 机 的 能 力 。 

这 样 的 一 个 事实 ， 即 在 我 们 前 面 的 例子 中 看 上 去 已 经 解决 了 停机 问题 ， 而 现在 却 声称 停 
机 问题 是 无 解 的 ， 听 起 来 有 些 矛盾 。 所 以 这 里 要 暂停 下 来 加 以 解释 。 前 面 例子 中 所 用 到 的 考 
察 只 对 那些 特定 的 情况 适用 ， 而 不 能 将 其 运用 到 所 有 的 情况 中 去 。 停 机 问题 所 要 求 的 是 一 种 
单一 的 、 一 般 性 的 算法 ， 并 能 够 用 在 任何 的 Bare Bones 程 序 中 ， 以 确定 它 是 否 是 自 终止 的 。 这 
里 ， 这 样 一 个 事实 ， 即 运用 某 些 孤立 的 观察 能 力 来 确定 某 个 程序 是 否 为 自 终止 的 ， 决 不 是 意 
味 看 存在 着 一 个 单一 的 、 通 用 的 且 能 够 适用 于 所 有 情况 的 方法 。 简 而 言 之 ， 我 们 也 许 能 够 建 
造 出 能 够 解决 某 个 特定 问题 的 机 器 ， 但 是 不 能 建造 出 一 个 单一 的 机 器 ， 使 之 能 用 来 解决 出 现 
的 任何 停机 问题 。 


12.4.2 ”停机 问题 的 不 可 解 性 


现在 ， 我 们 要 来 证 明 求解 停机 问题 超出 了 机 器 的 能 力 。 我 们 的 方法 是 要 证 明 ， 解 决 这 类 问 
题 将 需要 一 个 用 来 计算 不 可 计算 函数 的 算法 。 所 考虑 函数 的 输入 是 Bare Bones 程 序 的 编码 形式 ， 
其 输入 仅 限 于 0 和 1。 更 准确 地 说 ， 我 们 这 样 定 义 这 个 函数 ， 表 示 一 个 自 终 止 程序 的 输入 就 产生 
输出 值 1， 而 表示 一 个 非 自 终止 程序 的 输入 则 产生 输出 值 0。 为 了 简明 起 见 ， 称 这 个 函数 为 停机 
函数 (halting 名 nction )。 

我 们 的 任务 驶 是 要 证 明 : 停机 函数 是 不 可 计算 的 。 所 用 到 的 方法 是 “ 反 证 法 ” 简 而 言 之 ， 
要 证 明 一 条 语句 为 假 ， 只 需 证 明 它 不 为 真 即 可 。 于 是 ， 让 我 们 来 证 明 语 名 “停机 函数 是 可 计算 
的 ”不 为 真 。 我 们 的 整个 的 论据 都 概括 在 图 12-7 中 。 

如 采 停 机 函数 是 可 计算 的 ,那么 (因为 Bare Bones 语 言 是 一 种 通用 程序 设计 语言 ) 一 定 存 
在 一 个 能 计算 该 函数 的 Bare Bones 程 序 。 换 名 话说， 存在 一 个 Bare Bones 程 序 ， 如 果 它 的 输入 
是 一 个 目 终止 程序 的 编码 形式 ， 那 么 它 就 将 以 输出 值 等 于 1 而 终止 ， 否 则 就 以 输出 值 等 于 0 而 
终止 。 

为 了 用 这 个 程序 ， 我 们 并 不 需要 确认 哪个 变量 是 输入 变量 ， 而 只 需 把 程序 的 所 有 恋 量 初始 
化 为 被 测试 程序 的 编码 表示 即 可 。 这 是 因为 ， 如 果 一 个 变量 不 是 输入 变量 ， 那 么 它 的 初始 值 本 
质 上 是 不 会 影响 到 最 终 的 输出 值 的 。 所 以 ， 可 以 这 么 说 ， 如 果 停 机 函数 是 可 计算 的 ， 那 么 就 存 
在 下 面 这 样 一 个 Bare Bones 程 序 ， 如 果 其 所 有 变量 都 初始 化 成 一 个 自 终 止 程 序 的 编码 形式 ， 那 
人 么 它 将 以 输出 值 等 于 1 而 终止 ， 否 则 将 以 输出 值 等 于 0 终止 。 

假设 谅 程 序 的 输出 变量 名 为 X〈 如 果 不 是 ， 则 对 变量 进行 简单 的 更 名 即 可 )， 我 们 可 以 在 程 
序 的 最 后 加 上 以 下 的 语句 来 修改 这 个 程序 ， 从 而 产生 了 一 个 新 程序 : 
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while X not 0 adoc; 
忆 刀 加 ; 


而 这 个 新 程序 必须 要 么 是 自 终 止 的 ， 要 么 就 不 是 。 然 而 ， 我 们 将 会 看 到 ， 它 两 者 都 不 是 。 


散 先 ; 提议 存在 一 个 程序 它 然后 , 如 果 存 在 这 样 的 程序 , 那么 我 现在 : 如 果 新 程序 是 自 






任何 编码 形式 ee 以 它 自己 的 编 玛 
作为 输入 开始 
执行 到 达 这 
人 放 基干 于 | 


提议 的 程序 





提议 的 程序 





若 输 入 表示 一 个 自 
终止 程 序 ， 则 入 变 
量 x 等 于 [停止 ， 否 5 所 以 执行 永远 陷 
则 以 X 等 于 0 停止 入 到 这 个 循环 中 
也 就 是 说 , 如 果 新 程 
序 是 自 终止 的 , 那 委 
然而 ， 如 果 这 个 新 程序 不 它 不 是 自 终止 的 
是 自 终 正 的 ， 并 且 
以 它 自己 的 纺 
码 作 为 输入 结果 ， 
执行 到 达 这 一 提议 的 程序 存在 新 程序 存在 
点 ，X 等 于 0 









提议 的 程序 提议 的 程序 医 医 有 二 四 区 
提议 的 程序 止 的 也 不 是 
钵 轴 二 本 其 非 目 终 目的 





TO 站 语 ; 





所 以 会 跌 
过 此 逢 环 





| 主 阅 本 ; 


所 以 ， 提 该 的 程 
执行 会 停止 序 不 可 能 存在 


也 屿 是 说 ， 如 果 新 程序 不 是 自 
终止 的 ,那么 它 是 自 终 下 的 


图 12-7 证 明 停机 程序 的 不 可 解 


具体 来 说 ， 如 果 这 个 新 程序 是 自 终止 的 ， 且 以 初始 化 为 该 程序 自身 的 编码 表示 的 变量 来 
执行 这 个 程序 ， 那 么 当 它 执行 到 我 们 所 加 的 while 语 名 时 ， 变 量 x 将 为 1。( 在 这 -点 土 ， 这 个 
新 程序 与 原始 程序 一 样 ， 如 果 其 输入 是 一 个 自 终止 程序 的 表示 ， 那 么 就 会 产生 -一 个 1.) 在 这 
一 所， 程序 的 执行 将 会 始终 陷入 在 while-ena 结 构 中 ， 因为 在 这 个 循环 中 没有 提供 让 X 值 递减 
的 措施 。 但 是 ， 这 与 关于 新 程序 是 自 终止 的 假设 相 矛 盾 ， 因 此 ， 我 们 必然 得 出 结论 ， 新 程序 
个 是 目 终 止 的 。 

然而 ， 如 果 这 个 新 程序 不 是 自 终止 的 ， 且 以 初始 化 为 该 程序 自身 的 编码 表示 的 变量 来 执行 
这 个 程序 ， 那 么 当 它 执行 到 我 们 所 加 的 while 语 名 时， 变量 X 就 赋值 为 0 (之 所 以 会 这 样 ， 是 因 
为 在 该 while 语 句 之 前 的 语句 构成 的 原始 程序 ， 在 其 输入 表示 一 个 非 自 终止 程序 时 ， 产 生 一 个 
栓 出 0.) 在 这 种 情况 下 ，while-ena 结 构 中 的 循环 将 会 被 避免 ， 且 程 序 也 会 停止 。 但 是 ， 这 正 
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是 目 终止 程序 的 特性 ， 所 以 ， 我 们 不 得 不 得 出 结论 ， 该 新 程序 是 自 终 止 的 。 这 正如 早 些 时 候 我 
们 不 得 不 认为 它 不 是 自 终止 的 。 

概括 来 说 ， 可 以 看 出 ， 我 们 遇 到 了 程序 中 的 一 个 不 可 能 的 情况 ， 即 一 方面 程序 必须 要 么 是 
目 终 止 的 ， 要 人 么 不 是 ;而 另 一 方面 程序 又 必须 既 不 是 自 终止 的 ， 又 不 是 非 自 终止 的 。 其 结果 是 ， 
导致 这 种 矛盾 的 假设 必定 不 成 立 。 

我 们 可 以 得 出 结论 : 停机 函数 是 不 可 计算 的 。 因 为 停机 问题 的 解决 依赖 于 这 个 函数 的 计算 ， 
所 以 我 们 必然 得 出 结论 : 停机 问题 的 解决 超出 了 任何 算法 系统 的 能 力 范围 。 这 种 问题 被 称 为 不 
可 解 问 题 (unsolvable problem )。 

最 后 ， 把 刚才 讨论 过 的 内 容 与 第 11 章 中 的 思想 联系 起 来 。 第 11 章 中 一 个 非常 基本 的 问题 就 
生计 咎 机 器 的 能 力 是 否 包含 智能 本 身 所 需要 的 能 力 。 回 想 一 下 , 机 器 只 能 解决 有 算法 解 的 问题 ， 
而 现在 已 经 发 现 有 些 问题 没有 算法 解 。 因 此 ， 问 题 就 在 于 人 类 的 大 脑 是 否 包含 了 比 执行 算法 过 
程 更 多 的 东西 ? 如 果 没 有 ， 那 么 我 们 在 这 里 所 确定 出 的 局 限 性 ， 也 就 是 人 类 思想 的 局 限 性 。 不 
几 次 ， 这 是 一 个 极 具 争 议 的 问题 ， 有 时 也 是 情绪 方面 的 问题 。 例 如 ， 如 果 人 的 大 脑 只 不 过 是 纺 
程 过 的 机 器 的 话 ， 那 么 可 以 推断 出 ， 人 类 就 不 再 拥有 自由 的 意志 。 


问题 与 练习 

1. 下 面 的 Bare Bones 程 序 是 自 终 止 的 吗 ? 请 解释 你 的 答案 。 
诗 丽 已 工 并 ; 
如 此 己基 ET 

.下面 的 Bare Bones 程 序 是 自 终止 的 吗 ? 请 解释 你 的 答案 。 


CE 本 


上 kw 


开本 
1 性 革 ; 
wHile X not 0 ao 
加 号 工 
加 世 安 工 
局 人 CT 


km 


这 已 己 工 
全 列 司 
品 人 GeCr 和 世 ， 
While 苹 not 站 ae; 
ET: 


下 面 的 场景 有 什么 不 对 ? 

在 某 个 社区 里 ， 每 个 人 都 拥有 自己 的 房子 .。 社区 的 房屋 油漆 工 声 称 ;: 椰 要 对 社区 内 的 
所 有 房 屋 进行 涂 漆 ， 但 是 只 对 那些 没有 被 屋 主 自己 漆 过 的 房屋 ，( 提示 : :是 谁 来 法 沿 这 江 
的 房屋 ? ) 


和 
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ER 四 ES aa 


[ea 和 :时 二 所 -让 本 所 生生 生生 古 0 记 后 Fol 加 和 oa 四 二 ， e Pd 
人 色 , 1 二 1 Ti 且 - 





在 12.4 节 中 ， 已 经 讨论 过 问题 的 可 解 性 。 本 节 我 们 关注 的 问题 是 一 个 可 解 的 问题 是 天 有- 
之 宁 怀 解 ， 各 们 将 会 发 现 ， 有 些 问题 在 理论 上 是 可 解 的 ， 但 由 于 过 于 复杂 ， 从 实际 的 观点 来 看 
它们 是 无 解 的 。 


而 


人 六 


= 省 
了 
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12.5.1 问题 复杂 性 的 度量 


我 们 从 回 到 5.6 节 中 的 关于 算法 效率 的 研究 开始 。 在 那里 , 我 们 用 大 写 的 希腊 字母 日 来 标记 ， 
并 根据 算法 执行 所 需 的 时 间 来 对 其 进行 分 类 。 我 们 发 现 ,插入 排序 算法 属于 日 ( 轨 这 一 类 ， 顺 序 
查找 算法 属于 日 (四 ， 而 二 分 查找 算法 则 属于 日 (lg 四 。 现 在 ， 利 用 这 个 分 类 系统 来 帮助 我 们 确定 
问题 的 复杂 性 。 我 们 的 目标 是 开发 出 一 种 分 类 系统 ， 使 其 能 告诉 我 们 哪些 问题 比 另 一 些 问题 更 
为 复 氏 ， 并 最 终 确 定 出 哪些 问题 太 过 复杂 ， 以 致 于 实际 上 不 能 解 。 

我 们 现在 的 研究 之 所 以 是 基于 算法 效率 的 知识 ， 其 原因 在 于 希望 从 解 题 的 复杂 性 角度 来 衡 
量 一 个 问题 的 复杂 人 性。 我 们 认为 : 一 个 简单 问题 就 有 一 个 简单 的 解法 ， 一 个 复杂 的 问题 就 没有 
一 个 税 单 的 解法 。 可 以 注意 到 这 样 一 个 事实 ， 一 个 问题 有 一 个 复杂 的 解 并 不 一 定 意 味 着 该 问题 
本 身 很 复杂 。 上 毕竟 ， 一 个 问题 可 以 有 许多 解 ， 而 其 中 的 某 个 解 必然 会 复杂 些 。 所 以 ， 如 果 要 确 
定 一 个 问题 本 身 很 复杂 ， 那 么 就 需要 证 明 它 的 所 有 解 都 不 简单 。 

在 计算 机 科学 领域 中 ， 让 人 感 兴趣 的 问题 就 是 那些 机 器 能 够 解 的 问题 。 这 些 问 题 的 解 都 明 
确 地 表示 为 算法 。 所 以 ， 问 题 的 复杂 性 取决 于 解决 该 问题 的 算法 的 特性 。 更 为 准确 地 说 ， 解 决 
一 个 问题 的 最 简单 算法 的 复杂 性 可 以 被 认为 是 该 问题 本 身 的 复杂 性 。 

但 是 ， 如 何 来 度量 一 个 算法 的 复杂 性 呢 ? 遗憾 的 是 ， 术 语 复 杂 性 〈complexity) 有 着 不 同 的 
解释 。 一 种 解释 就 涉及 一 个 算法 中 所 包含 的 判定 和 分 支 数 量 。 如 果 按 照 这 种 理解 ， 那 么 一 个 复 
杂 的 算法 将 会 有 着 盘根错节 的 判定 和 分 支 。 这 种 解释 也 许 能 够 和 软件 工程 师 的 观点 相 一 致 ， 软 
件 工 程 师 对 与 算法 发 现 和 表示 相关 的 问题 感 兴趣 ， 但 是 这 并 没有 获得 从 机 器 的 观点 所 看 到 的 复 
杂 性 的 概念 。 机 器 在 选择 下 一 条 要 执行 的 指令 时 ， 其 实 并 没有 做 实际 的 判断 工作 ， 它 只 是 一 遍 
一 饥 地 遵循 机 器 周期 ， 每 次 执行 的 都 是 程序 计数 器 所 给 出 的 指令 。 所 以 ， 机 器 能 够 执行 一 组 看 
上 去 很 杂乱 的 指令 ， 而 事实 上 ， 它 就 像 在 执行 一 串 简单 有 序 的 指令 那样 轻松 。 所 以 ， 复 杂 性 的 
解释 倾 问 于 度量 一 个 算法 在 表示 中 所 遇 到 的 难度 ， 而 不 是 算法 本 身 的 复杂 性 。 

从 机 器 观点 来 看 ， 能 够 更 为 准确 地 反映 算法 复杂 性 的 一 种 解释 是 ， 要 度量 执行 这 个 算法 时 
所 必须 宛 成 的 步骤 的 数目 。 注 意 ， 这 个 数目 与 写 好 的 程序 中 所 出 现 的 指令 数目 是 不 一 样 的 。 其 
科 环 体 只 有 一 条 语句 ， 但 是 其 控制 要 求 这 个 循环 体 执行 100 次 的 循环 ,在 它 被 执行 时 ， 就 相当 于 
执行 100 条 指令 。 所 以 ,这样 一 个 例 程 被 认为 要 比 一 串 50 条 分 开 写 的 语句 更 为 复杂 ， 尽 管 后 者 在 
书 与 形式 上 显得 更 长 。 对 复杂 性 的 度量 而 言 ， 其 关键 点 在 于 最 终 关 系 到 机 器 在 执行 一 个 解法 时 
所 伦 的 时 间 ， 而 不 是 关系 到 用 来 表示 解 的 程序 的 大 小 。 

所 以 ， 如 果 一 个 问题 的 所 有 解 都 需要 大 量 的 时 间 ， 那 么 就 认为 这 个 问题 是 复杂 的 。 这 种 复 
杂 性 的 定义 称 为 时 间 复 杂 性 (time complexity)。 通 过 在 5.6 节 中 的 算法 效率 的 学 习 ， 我 们 已 经 间 
接地 遇 到 了 时 间 复 杂 性 这 个 概念 。 终 究 ， 对 算法 效率 的 研究 就 是 对 算法 时 间 复 杂 性 的 研究 ， 两 
痢 仅仅 是 互 为 相反 。 也 就 是 说 ,“ 较 高 的 效率 ”等 于 “ 较 低 的 复杂 性 ”。 所 以 ， 从 时 间 复 杂 性 的 
角度 看 ， 在 解决 一 个 表单 搜索 问题 时 ， 顺 序 查找 算法 〈 它 是 属于 B@ UnD) 要 比 二 分 查找 算法 〈 它 
是 属于 日 (llgm) 更 为 复杂 。 

现在 ， 我 们 运用 算法 复杂 性 方面 的 知识 来 获得 一 个 确定 问题 复杂 性 的 方法 。 在 解 一 个 问 
题 时 ， 如 果 存 在 一 个 算法 ， 其 时 间 复 杂 性 为 @(fto)， 并 且 没 有 解决 该 问题 的 其 他 算法 有 比 这 
更 低 的 时 间 复 杂 性 ， 那 么 我 们 就 定义 这 个 问题 的 (时 间 ) 复杂 度 为 @Uron)， 这 里 六 是 m 的 革 
个 数学 表达 式 。 也 就 是 说 ， 一 个 问题 的 《时 间 ) 复杂 性 定义 为 该 问题 的 最 优 解 的 《时 间 ) 复 
杂 性 。 但 是 ， 找 到 一 个 问题 的 最 优 解 和 确认 该 解 为 最 优 解 本 身 往往 就 是 一 个 难题 。 在 这 样 的 
情况 下 ， 一 个 大 @ 标 记 的 变种 ， 称 之 为 大 0 标记 (big Onotation)， 被 用 来 表示 对 一 个 问题 的 
复杂 性 的 了 解 程序 。 更 为 准确 地 说 ， 如 果 广 (四 是 m 的 某 个 数学 表达 式 ， 并 且 如 果 一 个 问题 能 够 
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被 属于 @(f (m) 的 算法 所 解决 ， 那 么 我 们 就 说 ， 这 个 问题 是 属于 OU (D) 的 。 这 样 一 来 ， 如 果 
说 一 个 问题 是 属于 OU (oO) 的 ， 那 么 也 就 意味 着 这 个 问题 有 一 个 复杂 性 属于 @Ur oo) 的 解 ， 但 
是 它 可 能 还 有 更 优 解 。 

对 查找 和 排序 算法 的 研究 告诉 我 们 ， 一 个 长 度 为 上 的 表 (这 时 已 经 知道 表 预 先 已 经 排序 好 ) 
的 查找 问题 是 属于 O dgm) 的 ， 这 是 因为 二 分 查找 算法 能 够 解决 这 个 问题 。 而 且 ， 研 究 人 员 已 经 
证 明 ， 碍 找 问 题 确实 是 属于 @ gm 的 ， 所 以 二 分 查找 算法 就 代表 了 这 个 问题 的 最 优 解 。 相 反 ， 
我 们 知道 ,对 一 个 长 度 为 m 的 表 ( 这 时 是 不 知道 表 中 原始 值 的 分 布 情况 ) 的 排序 问题 就 属于 O 0n2)， 
这 是 因为 是 用 插入 排序 算法 来 解决 这 个 问题 的 。 然 而 ， 知 道 排序 问题 是 属于 @ (algm， 这 就 告诉 
我 们 ， 插 入 排序 算法 不 是 最 优 解 〈 从 时 间 复 杂 性 的 角度 看 )。 

排序 问题 的 一 个 更 好 的 解决 办 法 是 归并 排序 算法 。 其 方法 是 将 表 的 一 些 较 小 的 、 排 序 过 的 
部 分 归并 成 较 大 的 、 排 序 好 的 部 分 ， 然 后 再 进行 归并 ， 得 到 更 大 的 排序 过 的 部 分 。 每 次 归并 过 
程 痢 是 利用 在 讨论 顺序 文件 时 所 遇 到 的 归并 算法 〈 见 图 9-15)。 为 了 方便 ， 再 用 图 12-8 来 表示 ， 
而 这 次 的 情况 是 归并 两 个 表 。 完 整 的 《递归 ) 归并 排序 算法 可 由 图 12-9 中 所 示 的 MergeSort 过 程 
来 表示 。 当 要 求 对 一 个 表 排 序 时 ， 这 个 过 程 首 先 检 查 被 排序 的 表 ， 看 其 是 否 少 于 两 个 数据 项 ， 
如 抹 是 , 则 该 过 程 的 任务 已 经 完成 ; 如 果 不 是 , 则 这 个 过 程 将 表 分 成 两 半 ， 再 请 求 过 程 MergeSort 
的 习 外 一 个 副本 对 这 两 段 进 行 排序 ， 然 后 将 这 些 排序 好 的 片段 归并 在 一 起 ， 这 样 就 得 到 最 后 的 
排序 过 的 表 。 





procedure MergeLists (inputLista, InputListB, OutputList] 
计 ( 两 个 输入 表 为 空 then (Stop, DutputList 为 守 ) 
放 (InputList 为 空 ) 
then (声明 它 是 饥饿 的 ) 
else (声明 它 的 第 一 项 为 当前 项 ) 
证 (InputListB 为 空 ) 
then (声明 它 是 饥 馈 的 ) 
else (声明 它 的 第 一 项 为 当前 项 ) 
while (两 个 输入 表 都 是 饥饿 的 )do 
(把 较 小 的 当前 项 放 入 口 utputList; 
计 (该 当前 项 是 对 应 输入 表 的 最 后 一 项 ) 
then (声明 该 输入 表 是 饥饿 的 ) 
else (声明 该 输入 表 的 下 一 项 为 该 表 的 当前 项 ) 














) 
从 未 完 的 输入 表 中 的 当前 项 开始 ， 剩 下 的 项 复制 到 OutputList。 





图 12-8 用 来 归并 两 个 表 的 过 程 MergelLists 


Procedure MereeSort (List) 


计 {List 有 才 于 一 个 项 ) 
then (应 过 程 MergeSort 来 对 List 的 第 一 部 分 进行 排序 ， 


应 过 程 MergesSort 来 对 List 的 第 二 部 分 进行 排序 ， 
应 过 程 MergeLists 合 并 List 的 第 一 部 分 和 第 二 部 分 生成 一 个 已 排序 的 List 
) 





图 12-9 ”实现 为 过 程 MergesSort 的 归并 排序 算法 


为 了 分 析 这 个 算法 的 复杂 性 ， 首 先 来 考虑 在 归并 一 个 长 度 为 r 的 表 和 一 个 长 度 为 * 的 表 时 ， 必 
须要 在 表 的 数据 项 之 间 进 行 比较 的 次 数 。 归 并 过 程 是 这 样 进 行 的 ， 重 复 地 对 -一 个 表 中 的 数据 项 与 


改 一 个 表 中 的 数据 项 进行 比较 ， 然 后 将 两 者 中 的 “ 较 小 项 ” 放 入 到 输出 表 中 。 这 样 一 来 ， 每 次 做 


一 次 比较 ， 那 么 还 要 考虑 的 〈 也 就 是 未 比较 的 ) 数据 项 的 数目 就 要 减 1。 由 于 开始 时 只 有 r+s 个 数 


所 和 
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据 项 ， 那 么 我 们 就 可 以 得 出 结论: 这 两 个 表 的 归并 过 程 所 包含 的 比较 次 数 不 会 多 于 r+ s 次 。 

现在 来 考虑 完整 的 归并 排序 算法 。 它 是 通过 这 样 的 方式 来 处 理 对 一 个 长 度 为 的 表 的 排序 工 
作 的 ， 即 将 最 初 的 排序 问题 简化 为 两 个 相对 较 小 的 问题 ， 每 个 都 要 对 一 个 长 度 约 为 w2 的 表 进 行 
排序 ， 接 下 来 再 对 这 两 个 问题 进行 分 割 ， 使 其 成 为 总 共 四 个 的 对 长 度 约 为 w4 的 表 进 行 排序 的 问 
题 。 这 种 分 割 过 程 可 以 由 图 12-10 中 的 树 结构 来 概括 ， 图 中 树 的 每 个 结 点 表示 的 递归 过 程 中 的 一 
个 问题 ， 并 且 一 个 结 点 下 面 的 分 支 表示 的 是 从 这 个 父 结 点 衍生 而 来 的 更 小 的 问题 。 所 以 ， 我 们 
可 以 及 现 ， 将 树 中 各 个 结 点 上 发 生 的 比较 次 数 加 起 来 ， 就 得 到 整个 排序 过 程 中 所 发 生 的 总 的 比 
较 次 数 。 


对 几 个 名 
字 的 表 排 序 


对 硼 的 前 对 表 的 后 
一 半 排 序 一 半 排 序 


AN， AN 


本 和 
个 和 后 人 和 当 全 


图 12-10 由 归并 排序 算法 产生 的 问题 的 层次 结构 


首先 ， 我 们 来 确定 树 的 每 层 上 所 进行 的 比较 的 次 数 。 可 以 看 出 ， 出 现在 树 的 任意 一 层 的 
每 个 结 点 ， 其 任务 都 是 对 初始 表 的 一 个 特定 段 进 行 排序 。 这 个 工作 由 归并 过 程 来 完成 ， 因 此 
正如 我 们 已 经 指出 过 的 ， 所 要 求 的 比较 次 数 不 会 多 于 该 表 段 中 的 数据 项 的 数目 。 因 而 ， 树 的 
每 一 层 所 要 求 的 比较 次 数 不 会 多 于 该 表 段 中 的 数据 项 的 总 数 ， 而 且 ， 因 为 树 中 所 给 定 的 一 个 
层 的 段 表 示 的 是 初始 表 所 分 割 的 部 分 ， 因 而 这 个 总 数 不 会 比 初 始 表 的 长 度 大 。 因 此 ， 树 的 每 
一 层 所 包含 的 比较 次 数 都 不 会 多 于 m。( 当 然 ， 最 底层 所 包含 的 排序 表 的 长 度 小 于 2， 因 而 根本 
隐 不 需要 比较 了 。) 

现在 来 确定 树 中 的 层 数 。 为 此 ， 可 以 看 到 ， 把 问题 分 割 成 更 小 的 问题 这 个 过 程 一 直 进 行 到 
所得 到 表 的 长 度 小 于 2 为 止 。 这 样 一 来 ， 树 中 的 层 数 就 由 分 割 的 次 数 所 确定 ， 从 值 m 开 始 ， 反 复 
的 除 以 2， 直 到 其 结果 不 大 于 1， 那 么 这 个 次 数 就 是 lgn。 更 为 准确 地 说 ， 树 中 所 涉及 的 比较 层 数 
不 多 于 | lgz|， 这 里 ， 标 记 fgz| 表 示 的 是 将 lg nm 的 值 上 舍 入 为 整数 。 

最 后 ， 把 树 中 每 层 所 做 的 比较 次 数 乘 以 涉及 比较 操作 的 层 数 ， 这 样 就 得 到 了 在 对 长 度 为 mn 的 
表 进 行 排序 时 ， 归 并 排序 算法 所 做 的 总 的 比较 次 数 。 可 以 确定 ， 这 个 次 数 不 大 于 m| ] 茎 于] 。 因 为 
?| lgz| 的 图 与 由 gm 的 图 在 形状 上 大 致 一 样 ,我 们 就 可 以 得 出 结论 : 归并 排序 算法 是 属于 Of(zlgm) 
的 。 把 这 个 结论 与 研究 人 员 告 诉 我 们 的 排序 问题 有 复杂 性 为 @(n lg 由 这 个 事实 相 结合 ， 这 就 意 
味 着 归并 排序 算法 代表 了 排序 问题 的 一 个 最 优 解 。 


空间 复杂 性 
除了 从 时 间 的 角度 来 度量 复杂 性 ， 还 有 一 种 方法 就 是 通过 度量 所 需 的 存储 空间 来 衡量 重 
杂 性 ， 我 们 将 这 种 度量 方法 称 为 空间 复杂 性 ( space complexity )。 也 就 是 说 ， 一 个 问题 的 空间 
复杂 性 是 由 解决 该 问题 所 需 的 存储 空间 的 数量 决定 的 .文中 我 们 已 经 看 到 ,一 个 有 P 个 数据 项 
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的 表 的 排序 复杂 性 属于 D(Pziem)。 而 这 个 问题 的 空间 复 末 性 将 不 超过 OU+T=OUD)。 要 知道 ， 利 
用 插入 排序 对 一 个 有 7 个 数据 项 的 表 进 行 排序 ， 需 要 存放 表 本 身 的 室 间 ,还 要 加 上 用 来 存放 虱 
时 数据 项 的 空间 。 这样 一 来 ， 如 果 要 对 越 来 越 长 的 表 进 行 排序 ， 那 么 将 会 发 现 ， 每 个 任务 所 要 
求 的 时 间 比 所 要 求 的 空间 增长 要 快 得 多 。 事实 上 ， 这 是 一 个 很 常见 的 现象 。 因 为 利用 空间 也 要 
花 蔓 时 间 ， 所 以 一 个 问题 的 空间 复杂 性 永远 不 会 比 它 的 时 间 利 杂 性 增长 得 更 快 。 


通常 会 在 时 间 复杂 性 和 空间 复杂 性 之 间 做 出 一 些 折 中 。 在 菜 些 应 用 场合 中 ， 为 了 方便 会 


事先 进行 革 些 计算 ， 并 将 计算 结果 以 表格 的 形式 存放 起 来 ， 这 样 一 来 ， 在 需要 时 就 能 通过 表 
格 很 快 地 检索 到 。 这 样 一 种 “ 查 表 ” 技 术 实际 上 是 通过 表格 所 需 的 额外 空间 的 代价 来 换取 获 
取 数 据 所 需 时间 的 减少 。 另 一 方面 ， 通 常用 数据 压缩 来 减少 对 存储 空间 的 需求 ， 其 代价 是 数 
据 压 缩 和 解压 缩 所 需要 的 额外 时 间 ， 


12.5.2 多项式 问题 与 非 多 项 式 问题 


假设 六 om 和 sg(m) 是 数学 表达 式 。 如 果 要 说 g(m) 是 受 约束 的 ， 那 么 这 就 表示 当 把 这 些 表 达 式 
用 在 越 来 越 大 的 " 值 上 时 ， 太 的 值 最 终 将 会 大 于 sg(m) 的 值 ， 并 且 对 所 有 更 大 的 m 值 ，F(OD 都 将 保 
持 大 于 g(]。 换 句 话 说 ， 如 果 g(m 中 是 受 /) 的 约束 ， 那 么 也 就 意味 着 对 于 “ 较 大 ”的 m 值 ， 太 的 
图 像 将 会 在 gs( 四 的 图 像 之 上 。 例 如 ， 表 达 式 lgm 受 表达 式 n 的 约束 〈 见 图 12-11a)， 而 相 gm 受 天 的 约 
束 《〈 见 图 12-11b )。 





疗 抹 
(al) 严 与 ]P 由) 到 与 mg 
图 12-11 数学 表达 式 m、lg ma、ma lg mn 和 好 的 图 


如 果 一 个 问题 是 属于 O(Aoo) 的 ， 其 中 ， 表 达 式 /要 人 么 本 身 是 一 个 多 项 式 ， 要 人 么 就 是 受 
一 个 多 项 式 约 束 ， 那 么 我 们 就 说 ， 这 个 问题 是 一 个 甸 项 式 问 题 (polynomial problem)。 所 有 多 
项 式 问 题 的 集合 用 P 表 示 。 注 意 ， 前 面 的 讨论 告诉 我 们 ， 表 的 查找 和 排序 间 题 就 属于 P。 

说 一 个 问题 是 多 项 式 问 题 ， 这 就 是 关于 解决 该 问题 所 需 时 间 的 一 种 陈述 。 我 们 经 常会 说 到 ， 
P 中 的 问题 能 够 在 多 项 式 时 间 范 围 解决 ， 或 者 说 ， 该 问题 有 多 项 式 的 时 间 解 。 

确定 出 属于 P 的 问题 是 计算 机 科学 中 非常 重要 的 课题 , 这 是 因为 ,这 个 问题 与 问题 是 否 有 实 
际 解 这 样 一 个 问题 密切 相关 。 确 实 ，P 类 之 外 的 问题 ， 其 特征 都 是 具有 极 长 的 执行 时 间 ， 即 使 是 
对 中 等 规模 的 输入 也 是 如 此 。 例 如 ， 考 虑 一 个 求解 需要 2 步 的 问题 。 指 数 表 达 式 2" 不 受 任何 多 
项 陈 的 约束 ， 也 就 是 说 ， 如 果 矿 (四 是 一 个 多 项 式 ， 那 么 ， 当 增加 z 的 值 时 ， 我 们 就 会 发 现 ，2” 的 
值 最 终 会 大 于 太 () 的 值 。 这 就 意味 着 , 如 果 一 个 复杂 性 为 日 (29 的 算法 通常 会 比 复杂 性 为 名 (凡人 ) 
的 算法 效率 低 ， 因 而 就 需要 更 多 的 时 间 。 如 果 一 个 算法 的 复杂 性 是 用 指数 表达 来 确定 的 ， 那 么 
就 说 该 问题 需要 指数 时 间 。 

作为 一 个 具体 的 例子 ， 考 虑 这 样 一 个 问题 ， 即 从 mr 个 人 组 成 的 群体 中 ， 列 出 所 有 可 能 的 小 组 
组 合 。 因 为 这 里 可 以 有 2"-1 种 这 样 的 组 合 〈 这 里 可 以 允许 一 个 小 组 包 依 所 有 的 人 ， 但 是 不 允许 
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小 组 中 没有 人 )， 所 以 解决 此 问题 的 任何 算法 必须 至 少 有 2"-1 步 ， 这 样 一 来 ， 其 复杂 性 也 至 少 这 
么 大 。 但 是 ， 表 达 式 2”-1 作 为 一 个 指数 表达 式 ， 不 受 任 何 多 项 式 的 约束 。 所 以 ， 随 着 可 选 人 群 
的 规模 的 增加 ， 对 这 个 问题 的 任何 解 所 花费 的 时 间 也 变 得 非常 庞 大 。 

上 面 的 分 组 问题 ， 其 复杂 性 非常 大 ， 这 只 是 因为 它 的 输出 规模 太 大 ， 而 与 此 不 同 的 是 ， 存 
在 看 这 样 的 一 些 问题 ， 虽 然 它们 最 终 仅仅 是 回答 是 或 否 这 样 简单 ， 但 是 其 复杂 性 却 非常 大 。 一 
个 例子 就 是 能 不 能 回答 涉及 实数 加 法 的 一 些 语句 的 真实 性 问题 。 举 例 来 说 ， 对 于 “存在 一 个 实 
数 ， 当 上 自身 相 加 时 就 得 到 值 6。 这 是 真 的 吗 ? ”这 样 的 一 个 问题 ， 我 们 就 很 容易 得 到 答案 ， 即 答 
生 为 其 。 而 对 “存在 一 个 非 零 实数 ， 当 自身 相 加 时 就 得 到 值 0。 这 是 真 的 吗 ? ”这 样 的 一 个 问题 ， 
显然 答案 为 假 。 然 而 ， 当 碰 到 这 类 问题 越 来 越 多 时 ， 我 们 回答 这 些 问题 的 能 力也 就 会 开始 减弱 
了 。 如 果 发 现 自己 要 面 对 许 多 这 样 的 问题 ， 那么 我 们 束 可 能 尝试 着 求助 于 计算 机 程序 的 帮助 。 
遗憾 的 是 ， 回 答 这 类 问题 的 能 力 已 经 证 明 需 要 指数 时 间 ， 所 以 ， 随 着 所 涉及 的 这 类 问题 越 来 越 
多 ， 最 终 的 结果 是 ， 即 使 是 计算 机 也 做 不 到 以 一 种 及 时 的 方式 来 得 到 答案 。 

理论 上 可 解 但 不 属于 P 的 问题 有 着 巨大 的 时 间 复 杂 性 ,这 一 事实 使 得 我 们 得 出 结论 从 实践 
的 观点 上 看 ， 这 些 问题 本 质 上 是 不 可 解 的 。 计 算 机 科学 家 称 这 类 问题 为 难 解 型 (intractable) 问 
题 。 从 而 , 头 型 P 成 为 了 用 来 区 别 难 解 的 问题 与 那些 可 能 有 实际 解 的 问题 之 间 的 一 个 重要 分 界线 。 
因此 ， 对 类 型 P 的 理解 已 经 成 为 了 计算 机 科学 领域 的 一 个 重要 研究 内 容 。 


12.5.3 NP 问题 


现在 来 考虑 旅行 商 问题 〈traveling salesman problem )， 翁 问 题 中 涉及 了 一 个 旅行 商 ， 他 必须 
生态 问 到 不 同城 市 的 每 个 客户 ， 其 花费 不 能 超出 他 的 出 差 预算 。 所 以 ， 他 的 问题 就 是 要 找到 一 
条 路 径 〈 从 家 里 出 发 ， 遍 历 有 关 的 城市 ， 然后 再 返回 他 的 家 里 )， 其 总 长 度 不 超过 允许 的 里 程 。 

这 个 问题 的 传统 解决 办 法 是 这 样 的 ， 以 系统 化 的 方式 来 考虑 各 种 可 能 的 路 径 ， 然 后 把 每 条 
路 径 的 长 度 与 里 程 的 限制 数 相 比较 ， 下 到 找到 一 条 可 接受 的 路 径 ， 或 者 是 把 所 有 可 能 的 路 径 都 
考虑 到 。 然 而 ， 这 种 方法 并 不 能 产生 一 个 多 项 式 时 间 解 。 随 着 城市 数目 的 增加 ， 所 要 测试 的 路 
径 数 目 比 任何 多 项 式 增 长 得 都 要 快 。 因 此 ， 在 所 涉及 城市 的 数目 很 多 的 情况 下 ， 按 照 这 种 方式 
来 解决 旅行 商 问题 是 不 实际 的 。 

我 们 可 以 得 出 结论 : 如 果 要 在 一 个 合理 的 时 间 范 围 内 解决 旅行 商 问 题 ， 必须 要 找到 一 个 更 
保 的 算法 。 如 果 存 在 着 一 个 令 人 满意 的 路 径 ， 并 且 旭 巧 一 开始 就 选择 了 这 条 路 径 ， 所 提出 的 算 
法 也 能 很 快 地 终止 ， 那 么 这 样 就 吊 起 了 我 们 的 胃口 。 具体 来 说 ， 下 面 的 指令 序列 能 够 很 快 地 执 
行 ， 并 且 也 有 解决 这 个 问题 的 潜力 ， 

取 一 个 可 能 的 路 径 ， 并 计算 其 总 距离 

if (此 距离 不 大 于 允许 的 里 程 数 ) 

then (宣布 找到 ) 
else (宣布 没 找到 ) 


然而 ， 从 技术 意义 上 讲 ， 这 组 指令 不 是 一 个 算法 。 它 的 第 一 条 指令 就 比较 模糊 ， 原 因 在 于 
它 婚 没有 指出 选择 的 是 哪 一 条 路 径 ， 艾 疫 有 说 明 是 如 何 做 出 这 样 的 决定 。 相 反 ， 它 是 依赖 于 程 
序 执行 机 制 的 创造 性 来 自己 做 决定 。 我 们 称 这 样 的 指令 为 不 确定 指令 , 并 将 包含 这 样 语句 的 “ 算 
法 ” 称 为 不 确定 算法 (nondeterministic algorithm ) 。 


确定 性 的 和 不 确定 性 的 
在 许多 情况 下 ， 一 个 确定 性 “算法 ”和 一 个 不 确定 性 “算法 ” 之 间 存 在 着 明显 的 界限 、 
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然而 ,这 种 差别 是 非常 清晰 和 明显 的 。 确 定性 算法 不 依赖 于 执行 该 算法 的 机 制 的 创造 性 能 力 ， 
而 不 确定 算法 可 能 会 依赖 ， 例 如 ， 比 较 指令 

走 到 下 一 个 十 字 路 口 ， 然 后 向 右 转 或 向 左 转 
与 指令 

走 到 下 一 个 十 字 路 口 ， 按 照 站 在 路 口 的 人 所 告诉 你 的 ， 向 右 转 或 向 左 转 
在 这 两 种 情况 中 ， 这 个 人 在 真正 执行 指令 之 前 ， 所 采取 的 转向 行动 都 是 不 确定 的 。 然 而 ， 第 
一 条 指令 要 求 行人 根据 自己 的 判断 来 决定 其 转向 ， 所 以 就 是 不 确定 的 。 第 二 条 指令 中 ， 对 行 
人 所 要 转 的 方向 就 不 做 这 样 的 要 求 ， 他 只 是 被 告知 每 一 步 做 什么 。 如 果 有 几 个 不 同 的 人 执行 
第 一 条 指令 ， 那 么 有 些 人 会 向 右 转 ， 而 有 些 人 会 向 左 转 。 如果 有 几 个 人 执行 第 二 条 指令 ， 并 
且 得 到 同样 的 信息 ,那么 他 们 将 会 朝 一 个 方向 转 。 这 里 包含 了 确定 性 “算法 * 和 不 确定 性 “ 算 
法 ”两 者 之 间 的 一 个 重要 区 别 。 如 果 用 同样 的 输入 数据 反复 去 执行 一 个 确定 性 算法 ， 那 么 每 
次 都 将 会 完成 同样 的 操作 。 然 而 ， 一 个 不 确定 性 算法 在 同样 的 条 件 下 反复 执行 ， 将 会 产生 不 
同 的 操作 。 


注意 到 ， 随 独 城 市 数目 的 增加 ， 执 行 上 述 不 确定 算法 所 需要 的 时 间 增 加 得 相对 较 慢 。 选 择 
一 条 路 径 的 过 程 仅仅 是 产生 一 列 城市 清单 ， 这 能 够 在 与 城市 数目 成 比例 的 时 间 范 围 内 完成 。 而 
且 ， 浙 看 所 选择 的 路 径 ， 计 算 总 距离 所 需 的 时 间 也 与 所 访问 的 城市 数目 成 正比 ， 并 且 ， 将 这 个 
由 数 与 里 程 的 限定 数 进行 比较 所 需 的 时 间 与 城市 的 数目 不 相关 。 于 是 ， 执 行 这 个 不 确定 算法 所 
需 的 时 间 就 受 一 个 多 项 式 约束 。 因 此 ， 就 有 可 能 在 多 项 式 时 间 内 ， 利 用 一 个 不 确定 算法 解决 旅 
行商 问题 。 

当然 ， 这 个 不 确定 解 并 不 能 完全 令 人 满意 ， 因 为 它 依赖 于 猜测 的 运气 。 但 是 ， 它 的 存在 足 
以 表明 : 在 多 项 式 时 间 内 ， 对 旅行 商 问题 而 言 ， 存 在 着 一 个 确定 性 的 解 。 无 论 其 真 假 与 否 ， 
它 虱 是 一 个 尚未 确定 的 问题 。 事 实 上 ， 有 许多 这 样 的 问题 ， 即 知道 他 们 在 多 项 式 时 间 范 围 内 
执行 时 有 不 确定 性 解 ， 但 又 还 没 发 现 多 项 式 时 间 内 的 确定 性 解 ， 旅 行商 问题 就 这 些 问题 中 的 
一 个 。 对 于 这 些 问题 的 不 确定 性 解 的 这 种 可 望 而 不 可 及 的 效率 ， 使 得 许多 人 希望 在 某 一 天 能 
找到 有 效 的 确定 性 解 ， 然 而 ， 大 多 数 人 相信 这 些 问题 太 复 杂 ， 以 致 于 超出 了 有 效 的 确定 性 算 
法 的 能 力 范 围 。 

一 个 能 够 在 多 项 式 时 间 内 用 不 确定 性 算法 解决 的 问题 , 称 为 非 确定 性 多 项 式 问 题 (nondeter- 
ministic polynomial problem)， 或 者 简称 NP 问 题 (CNP problem)。 习 惯 上 把 NP 类 问题 表示 成 NP。 
可 以 看 到 ， 所 有 P 中 的 问题 也 都 属于 NP 问 题 ， 这 是 因为 任何 〈 确 定性 ) 算法 都 可 以 加 上 一 条 非 
确定 指令 而 不 影响 其 执行 。 

然而 ， 正 如 旅行 商 问题 所 说 明 的 ， 所 有 的 NP 问 题 是 否 也 都 属于 P 问 题 还 是 个 尚未 确定 的 问 
题 。 在 今天 ， 这 也 许 是 计算 机 科学 领域 里 的 最 广为人知 的 未 解 问 题 。 这 个 问 题 的 解决 将 会 带 来 
芋 大 的 影响 。 例 如 ，12.6 节 我 们 将 讨论 到 ， 已 经 设计 出 来 的 加 密 系 统 其 完整 性 依赖 于 解决 问题 
所 下 的 大 量 时 间 ， 这 类 似 于 旅行 商 问 题 。 如 果 证 实 了 对 这 样 的 问题 存在 着 有 效 解 ， 那 么 这 些 加 
密 系统 的 安全 性 就 将 受到 威胁 。 

为 了 解 这 样 的 问题 〈 即 NP 类 问题 在 事实 上 是 否 等 同 于 P 类 问题 ) 而 作出 的 努力 ， 导 致 了 
在 NP 类 问题 中 发 现 了 一 类 称 为 NP 完 全 问题 (NP-complete problem) 的 问题 。 这 些 问 题 都 具有 这 
样 一 种 特征 ， 即 任何 一 个 问题 的 多 项 式 时 间 解 也 为 所 有 其 他 NP 类 问题 提供 了 一 休 多 项 式 时 间 
解 。 也 碟 是 说 ， 如 果 能 够 在 多 项 式 时 间 内 找到 一 个 〈 确 定 ) 算法 ， 使 其 能 够 解决 一 个 NP 完 全 问 
题 ， 那 么 这 个 算法 就 能 推广 到 以 多 项 式 时 间 来 解决 任何 其 他 属于 NP 的 问题 。 于 是 ，NP 类 就 和 P 
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头 一 样 。 旅 行商 问题 是 NP 完 全 问题 的 一 个 例子 。 

颁 括 来 说 ， 可 以 看 出 ， 问 题 可 以 分 为 可 解 《 有 一 个 算法 解 ) 和 不 可 解 〈 没 有 一 个 算法 解 ) 
丽 头 ， 如 图 12-12 所 示 。 而 且 ， 可 解 问题 可 分 为 两 个 子 类 。 一 类 是 多 项 式 问 题 的 集合 ， 该 集合 包 
含 了 有 实际 解 的 问题 。 另 一 类 是 非 多 项 式 问题 的 集合 ， 这 些 问题 只 有 当 输 入 相对 较 少 或 者 仔细 
选取 的 情况 下 才 有 实际 解 。 最 后 ， 还 有 比较 难 理解 的 NP 问 题 ， 至 今 还 没有 很 准确 的 分 类 。 





可 解 辣 题 不 可 解 问题 
r [上 
NP 坷 题 
才 项 式 非 多 项 
问题 式 问 题 


图 12-12 问题 分 类 的 一 个 概括 图 


问题 与 练习 

.假设 一 个 问题 能 够 通过 一 个 属于 日 (2 的 算法 求解 ， 半 么 对 这 个 问题 的 复杂 性 ， 我 们 能 得 出 什么 样 的 
结论 ? 

假设 一 个 问题 能 够 通过 一 个 属于 日 (的 算法 求解 ， 也 可 以 通过 另 一 个 属于 日 (2 的 算法 求解 ， 那 么 
是 吾 一 个 算法 总 是 要 优 于 另 一 个 算法 ? 

. 如 果 一 个 委员 会 由 Alice 和 B 记 两 个 成 员 组 成 ， 那 么 请 列 出 从 这 个 委员 会 所 能 够 构造 出 的 所 有 的 小 组 。 
如 条 这 个 委员 会 是 由 Aliece、Bil 和 Carol 组 成 ， 那么 请 列 出 从 这 个 委员 会 所 能 够 构造 出 的 所 有 的 小 组 。 
如 果 这 个 委员 会 是 由 Alice、Bil、Carolt 和 David 组 成 的 ， 那么 分 组 情况 又 会 怎样 ? 

4. 举 出 一 个 多 项 式 问题 的 例子 。 举 出 一 个 非 多 项 式 的 例子 。 尝 出 一 个 NP 问 题 的 例子 ， 但 是 它 尚未 被 证 
明 是 一 个 多 项 式 问 题 。 

- 如 果 算 法 X 的 复杂 度 比 算法 Y 的 复杂 度 要 大 ， 者 么 是 否 就 意味 着 算法 X 一 定 就 比 算法 Y 难 理解 ? 请 解释 
你 的 答案 。 
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在 某 些 情 况 下 ， 一 个 问题 难以 解决 这 样 一 个 事实 已 经 不 再 是 一 个 伍 点 ， 而 变 成 了 一 个 优点 。 
特别 有 趣 的 一 个 问题 是 ， 为 给 定 的 一 个 整数 找到 它 的 因数 ， 如 果 这 样 的 解 确实 存在 ， 那 么 就 一 
定 要 为 这 个 问题 找到 一 个 有 效 的 解 。 例 如 ， 如 果 只 用 笔 和 纸 ， 你 将 会 发 现 ， 即 使 像 2173 这 样 相 
对 较 小 的 数值 ， 要 找到 其 因数 也 比较 花 时 间 ， 而 如 果 涉 及 的 数 大 到 需要 用 几 百 位 数字 来 表示 ， 
那么 即使 用 现在 所 知 的 最 好 的 分 解 因 数 的 技术 ， 这 个 问题 还 是 难以 解决 。 

对 许多 数学 家 而 言 ， 全 今 还 没有 找到 一 种 有 效 的 方法 来 确定 大 整数 的 因数 ， 这 让 他 们 感到 
非常 不 安 。 然 而 ， 在 密码 学 领域 里 ， 这 种 情况 已 经 被 用 来 产生 一 种 对 报 文 进行 斩 密 和 解密 的 流 
行 方法 。 这 种 方法 称 为 RSA 算 法 (RSA algorithm)， 选 择 这 个 名 了 是 为 了 对 该 算法 的 发 明 者 Ron 
Rivest、Adi Shamir 和 Len Adleman 表 示 尊 敬 。 这 种 方法 , 利用 一 组 称 为 加 密 密 铀 (encrypting key) 
的 数值 对 报 文 进行 加 密 ， 并 利用 另 一 组 称 为 解密 密 铀 (decrypting key) 的 数值 对 报 文 进行 解密 。 
知道 加 密 密 钥 的 人 可 以 对 报 文 进行 加 密 ， 但 是 不 能 对 报 文 进 行 解 密 。 只 有 持 有 解密 密 钥 的 人 才 
能 对 报 文 进 行 解密 。 这 样 一 来 ， 加 密 密 钥 可 以 被 广泛 地 分 发 而 不 会 破坏 系统 的 安全 性 。 
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这 样 的 密码 系统 称 为 公 钥 加 密 (public-key encryption) 系统 ， 这 个 术语 反映 了 用 来 对 报 文 
加 密 的 密 钥 可 以 公开 而 不 会 降低 系统 的 安全 性 .事实 上 , 加 密 密 钥 通常 被 称 为 公 铀 (public key )， 
而 解密 密 钥 则 称 为 私 钥 (private key) 〈 见 图 12-13 )。 


位 模式 形式 的 
报 玄 用 会 铀 加 密 


上 六 宙 必 2 
司 3 玫 加 和 号 
人 叶 。 。 DT 
5 3 
= 


因为 不 知道 秘 铀 ， 所 以 
不 能 对 报 文 进行 解密 





用 秘 钥 对 报 女 进行 解密 


图 12-13 ” 公 钥 密码 学 
12.6.1 模 表 示 法 


为 了 描述 RSA 公 钥 加 密 系统 ， 可 以 方便 地 采用 记号 ztmod 四 ) 来 表示 数值 x 被 m 除 后 所 得 的 余 
数 , 这 通常 读 作 “zx mod 斑 ”。 这 样 一 来 , 9(mod 7) 就 得 2, 这 是 因为 9 二 7 的 余数 为 2。 类 似 地 , 24(mod 
7) 为 3， 这 是 因为 24 二 7 的 余数 为 3，14(mod 7) 为 0， 因 为 14 二 7 的 余数 为 0。 注 意 ， 如 果 * 是 一 个 0 到 
m-l 之 间 的 整数 ， 那 么 xmod mm) 的 值 就 为 zx 本身 。 例 如 ，4(mod 9) 的 值 就 为 4。 

由 数学 知识 我 们 知道 ， 如 果 p 和 4 是 素数 ， 六 是 0 到 pqg 〈 表 示 P 和 4 的 乘积 ) 之 间 的 一 个 整数 ， 
那么 ， 对 于 任意 的 正 整 数 上 ， 就 有 


1= 7 Po (mod pg) 


尽管 在 这 里 不 证 明 这 个 命题 ， 但 考虑 一 个 例子 来 解释 这 个 命题 还 是 有 必要 的 。 于 是 ， 我 们 假 议 P 
和 9 分 别 为 素数 3 和 5， 并 且 mm 为 整数 4。 那 么 ， 这 个 命题 说 ， 对 于 任意 的 正 整数 上 ， 值 习 % 9 … 除 
以 15〈3 和 5 的 乘积 ) 将 得 到 余数 1。 具 体 来 说 ， 如 采 人 1， 那 么 
JECP-LKG] 二 44 几 一 站 5 53 操 
正如 前 面 所 讲 的 ， 该 值 除 以 15 所 得 余数 为 1。 而 且 ， 如 果 k= 2， 那 么 
JECP 一 9 帮 2 一 6 2 村 294 中 和 了 DO 
”再 将 它 除 以 15 所 得 的 余数 为 1。 事 实 上 ， 无 论 正 整 数 k 的 取 值 如 何 ， 都 将 得 到 余数 1。 


12.6.2 ”RSA 公 钥 密码 系统 


现在 ， 我 们 准备 在 RSA 算 法 的 基础 上 构建 和 分 析 一 个 公 钥 加 蜜 系统 。 首 先 ， 选 出 两 个 不 同 的 
素数 p 和 9， 其 乘积 用 mn 来 表示 。 然 后 ， 另 外 选 出 两 个 正 整数 e 和 4d， 使 得 对 茶 个 正 整数 上 ， 满 足 eXd= 
KK (p-l)(g-lD +1。 将 值 eE 和 d 分 别 作 为 加 密 和 解密 过 程 的 组 成 部 分 。( 事 实 上， 所 选取 得 值 e 和 d 能 
够 满足 前 面 的 等 式 ， 这 在 数学 上 也 是 另 一 个 已 经 证 明 过 的 事实 ， 在 这 里 我 们 将 不 再 证 明 。) 

所 以 ， 这 里 我 们 选取 了 5 个 值 :， p、9、m、e 和 d。 值 e 和 mm 是 加 密 密 钥 ， 值 < 和 m 是 解密 密 铂 ， 


人 
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值 p 和 9 只 是 用 来 构建 加 密 系 统 。 

这 里 就 考虑 一 个 具体 的 例子 来 进行 说 明 。 假 设 将 值 p 和 5 分别 选取 为 7 和 13， 那 么 
nm=1x13=91。 而 且 ， 特 值 e 和 d 分 别 选 取 为 5 和 29， 因 为 $x 29=145=144 + 1 =2 (7-1 ) 
(13-1) +1=2 (P-1) (9g-1) +1， 这 正 是 所 需 的 。 这 样 一 来 ， 加 密 密 钥 就 是 mn=91 和 e=5， 
而 解密 密 铀 则 为 mr=91 和 d-29。 我 们 将 加 密 密 钥 分 发 给 想 要 给 我 们 发 报 文 的 人 ， 而 解密 
密 钥 ( 加 上 值 p 和 dg 一 起 ) 我 们 自己 保留 。 


我 们 现在 来 考虑 如 何 对 报 文 进 行 加 密 。 在 这 里 ， 假 设 当前 的 报 文 是 按照 位 模式 〔〈 可 能 用 的 
征 ASCI 纺 但 或 Unicode 码 ) 编码 的 ， 当 将 其 解释 为 二 进 制 表示 时 ,这 个 位 模式 的 值 就 小 于 mn (如 
采 它 不 小 于 ma， 就 要 把 报 文 分 割 成 较 小 的 段 ， 然 后 分 别 对 每 段 进 行 加 密 。) 

假设 当 报 文 解释 为 二 进 制 表示 时 ， 我 们 的 报 文 表示 值 mm。 那 么 ， 这 条 报 文 的 加 密 形 式 就 
秆 值 c=m (modm) 的 二 进 制 表示 。 也 就 是 说 ， 加 密 过 的 报 文 是 me 除 以 m 后 所 得 余数 的 二 进 
制 表示 。 


具体 来 说 ， 继 续 就 前 面 的 例子 来 进行 讨论 ， 如 果 某 人 想 要 用 加 密 密 钥 i =91 和 ce=5 

对 报 文 10111 进 行 加 密 ， 他 首先 会 看 出 ，10111 是 值 23 的 二 进 制 表 示 ， 那么 计算 234 = 235 

=6436 343， 了 最后， 将 此 值 除 以 = 91， 得 到 余数 为 4。 所 以 这 条 报 文 的 加 密 形 式 就 是 

100， 即 为 4 的 二 进 制 表示 。 

为 了 解密 一 条 用 二 进 制 记 法 表示 的 值 为 c 的 报 文 ， 就 要 计算 cdtmod 四 的 值 。 也 就 是 说 ， 计 
算 忆 的 值 ， 将 结果 再 除 以 m， 并 保留 所 得 的 余数 。 事 实 上 ， 这 个 余数 就 是 初始 报 文 的 值 疾 ， 这 
是 因为 

c“ (modpn) = me (mod 门 
至 meP GDt(mod mm 
一 丽江 mp DTD(mod 71) 
= mrfmod 7m) 
三 /1 


正如 前 面 所 述 ， 这 里 用 到 了 me emodm = meteDe(mod pg)=1， 以 及 m (mod 站 = 站 《 国 
为 弄 二 站) 。 


继续 讨论 前 面 的 例子 ， 如 果 收 到 报 文 是 100， 那 么 我 们 就 能 识别 出 这 个 值 为 4， 然 
后 计 莫 出 值 4 = 42 = 288 230 376 151 711 744， 将 此 值 除 以 有 = 91. 从 而 得 到 余数 23， 
即 为 用 二 进 制 表示 的 初始 报 文 10111. 


概括 来 说 ， 一 个 RSA 公 钥 加 密 系统 的 产生 过 程 是 这 样 的 : 选取 两 个 素数 p 和 4， 再 从 这 两 个 
数 产 生 值 w、e 和 d。 值 z 和 e 被 用 于 加 密 报 文 , 即 为 公 钥 ; 而 值 w 和 d 被 用 于 解密 报 文 , 即 为 私 钥 ( 见 
贸 12-14)。 这 个 系统 的 优势 就 在 于 只 知道 如 何 加 密 报 文 ， 而 不 能 解密 报 文 。 这 样 一 来 ， 加 密 密 
铀 和 e 可 以 被 广泛 地 分 发 。 如 果 你 的 对 手 得 到 了 这 些 加 密 密 铀 ， 但 是 他 们 还 是 不 能 够 对 他 们 所 
截获 的 报 文 进行 解密 ， 因 为 只 有 知道 解密 密 钥 的 人 才能 对 报 文 进行 解密 。 

这 种 系统 的 安全 性 的 基础 在 于 ,假定 只 知道 加 密 密 钥 和 e， 而 不 允许 计算 出 解密 密 钥 m 和 L 
然而 ， 确 实 有 这 样 的 算法 能 做 这 种 事情 ! 一 种 方法 是 对 值 ? 进 行 分 解 因 式 来 找到 p 和 v， 然 后 找 一 
个 k 值 ， 使 得 k -1)(9-D +1 被 e 整 除 〈 那 么 商 就 为 d)， 从 而 确定 了 d。 另 一 方面 ， 这 个 过 程 的 第 
一 步 就 可 能 很 花 时 间 ， 特 别 是 在 所 选 的 p 和 4 很 大 的 情况 。 事 实 上 ， 如 果 p 和 5 大 到 需要 用 几 百 个 
二 进 制 位 来 表示 时 ， 那 么 即使 用 最 好 的 分 解 因 式 算法 对 n 进 行 分 解 ,也 得 需要 好 几 年 的 时 间 才 能 
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确定 pP 和 9。 因 此 ， 一 条 加 密 过 的 报 文 的 内 容 ， 即 使 其 重要 性 已 经 过 时 很 名， 它 的 安全 性 仍然 能 
得 到 保证 。 


通过 对 P 和 9 两 个 大 素数 的 
选取 来 确定 密 钥 ma、e 和 d 


密 铜 x 和 e 提 供给 任何 要 ”时 ER 


对 报 文 进行 加 审 的 人 


P、9 和 和 d 的 值 古 保密 的 


图 12-14 建立 一 个 RSA 公 钥 加 密 系 统 


到 今天 ， 还 没有 人 能 够 在 不 知道 解密 密 钥 的 情况 下 ， 找到 一 种 对 基于 RSA 加 密 算法 加 密 的 
报 文 进行 解密 的 有 效 方法 ， 所 以 ， 基于 RSA 算 法 的 公 钥 加 密 技 术 广 泛 地 用 于 因特网 通信 ， 以 获 
取 通 信 的 秘密 性 。 588 


问题 与 练习 

1. 请 找 出 66 043 的 因数 。《〈 本 题 可 能 比较 费时 ， 不 必 花 费 太 多 的 时 间 。) 

2. 用 公 钥 m= 91 和 e = S$ 对 消息 101 进 行 加 密 。 

3. 用 私 铀 由 = 91 和 d29 对 消息 10 进 行 解密 。 

4 在 一 个 RSA 公 钥 密 码 系统 中 ， 根 据 素数 p = 7、9 =19 以 及 e = 5， 为 解密 密 钥 w 和 d 找 出 合适 的 值 。 


下 下 村 半生 站 下 直下 和 本 和 直下 辣 诗 0 此 r 基 区 了 生起 下 相 和 二 二 生生 人 并 丰 tr 和 生生 二 六 下 生 人 ia 有 的 上 


复习 题 


1. 请 说 明 一 下 ， 如 何 用 Bare Bones 语 言 模拟 如 下 
的 结构 ; 与 。 


While  _ eduals 0 aoc， 





b. 计算 整数 0 到 X 的 和 。 

写 一 个 Bare Bones 语 言 例 程 ， 将 值 X 除 以 值 
Y， 忽 略 余 数 。 也 就 是 说 ，1 除 以 2 得 0，5 除 
以 3 得 1。 

. 摘 述 由 下 列 Bare Bones 语 言 程序 计算 的 函 
数 ， 假 设 该 函数 的 输 六 由 X 和 YY 表示， 输出 由 
zZ 表 示 : 


人 


翁 科 思 ; 


2. 写 一 个 Bare Bones 语 言 程序 ， 使 得 ， 如 果 变 量 


X 小 于 等 于 变量 Y， 则 将 变量 z 堵 为 1， 否 则 将 

变量 z 团 为 0。 

. 写 一 个 Bare Bones 语 言 程序 , 将 变量 z 置 为 2 的 

X 光 方 。 

. 根据 以 下 每 种 情况 写 一 个 Bare Bones 语 言 程 

序 序列 ， 实 现 指 定 的 活动 。 

a， 如 乐 X 的 值 为 偶数 ， 则 将 z 赋 值 为 0， 理 则 z 
赋值 为 1。 


| 


COPY 其 七 口 蕊 ; 
CePY 立 七 口 有 AUXT 
while aux notct 0 ac 
Cecr 世 ; 
也 人 CT UX， 
人 ma ; 


. 描述 由 下 列 Bare Bones 语 言 程 序 计算 的 函 


数 ， 假 设 该 函数 的 输入 由 X 和 Y 和 表示， 输出 由 


384 


己 


过: 


14， 
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z 表 未: 


它 】 已 昌 Y 蕊 ; 
它 所 PPY 其 了 上 局 名 式 ] ) 
安 必 PPY 立 七 口 站 ULX， 
while Auxl not 0 do; 
while aux2a not 0 aqo; 
qdecr 了 
全 eCr 让 ULXZ: 
会 卫 吕 
巡 已 袜 让 QIX1; 
js 有 


. 写 一 个 Bare Bones 语 言 程序 ， 用 于 计算 变量 X 


和 变量 Y 的 异 或 ， 并 将 结果 存放 在 变量 z 中 。 
你 可 以 假设 X 和 Y 只 从 整数 0 和 1 开始 。 


, 如 果 我 们 允许 一 个 Bare Bones 程 序 中 的 指令 


可 以 用 整数 值 标号 , 并 且 把 while 循 环 结构 用 
形 如 


IT Pame net 0 goto 工 羡 Be] ; 


的 条 件 转移 指令 代替 ， 其 中 ，name 是 任意 一 
个 变量 ，labe1 是 一 个 整数 值 , 用 来 标记 别处 
的 一 条 指令 ,那么 请 证 明 : 这 个 新 语言 仍然 是 
一 种 通用 程序 设计 语言 。 

在 本 章 中 ， 我 们 已 经 看 到 ， 语 名 


人 日 BPY 吾 PE 七 已 成人 所 了 

如 何 用 Bare Bones 语 言 来 模拟 。 请 证 明 ， 如 果 
Bare Bones 语 言 中 的 while 循 环 结构 用 一 个 
形 如 


工 全 叫 at . . .Uni 【name eguals 0 ) 


的 后 测试 循环 结构 来 代替 ， 那 么 上 述 语 句 仍 
能 够 被 模拟 。 


证明: 如 果 while 语 名 用 一 个 形 如 


Iepeat .。 .UnEILI1L 《name equals 0 ) 


的 后 测试 循环 结构 来 代替 , Bare Bones 语 言 仍 
为 通用 语言 。 

设计 一 个 图 灵机 ， 要 求 它 一 旦 启动 , 将 不 会 使 
用 磁带 上 的 一 个 以 上 的 单元 , 而 且 永 不 会 到 达 
停 下 状态。 


.设计 一 个 图 灵机 , 要 求 将 当前 单元 左边 的 所 有 


单元 置 0， 直 到 遇 到 一 个 包含 有 星 号 的 单元 为 
止 。 

假设 图 灵机 的 磁带 上 0、1 横 式 串 的 两 端 是 用 星 
与 作为 分 界 符 的 , 那么 请 设计 一 个 图 灵机 , 将 


18. 


之 1 


2 


此 模式 左 移 一 个 单元 , 这 里 假设 机 器 是 从 当前 
单元 右 问 星 号 处 开始 。 


- 设计 一 个 图 灵机 ， 要 求 把 在 当前 单元 ( 它 包含 


有 一 个 星 号 ?和 其 左边 的 第 一 个 星 号 之 间 所 发 
现 的 0、1 模 式 串 倒转 。 


. 概述 丘 奇 -图 灵 论 题 。 
. 下 面 的 Bare Bones 语 言 程 序 是 自 终 止 的 吗 ? 


请 说 明理 由 。 


人 和 PEWY 其 七 白 芋 ; 
上 C 姜 至 ; 
ner 芋 ; 
whlle X not 0 ao; 
ecCI 其 ; 
中 ee 其 
巡 ECT 了 ; 
局 ee 芋 ; 
局 耻 司 
马公 C 工 芋 ; 
while Yy no 0 aqc; 
imer 时 ; 
台 已 C 区 ; 
ss 
while X no 0 ao 
is 


下 面 的 Bare Bones 语 言 程序 是 自 终 止 的 吗 ? 
请 说 明理 由 。 


while X not 口 Go; 
会 卫 可 ; 


. 下 面 的 Bare Bones 语 言 程 序 是 自 终 止 的 吗 ? 


请 说 明理 由 。 


wh1lle 其 mot 0 ao， 


[1 
全 也 癌 


: 分 析 下 面 一 对 命题 的 有 效 性 : 


The TeXt Statement LS 七 Ue 
The 疡 FevIous 引 ttemernt 1 七 忆 了 总 所 


分 析 命 题 “船上 的 厨师 为 所 有 人 做 饭 , 但 只 为 
那些 自己 不 做 饭 的 人 做 饭 。” 的 有 效 性 。( 提 
示 : 谁 为 厨师 做 饭 ? ) 

假设 你 在 一 个 国家 , 这 个 国家 的 人 要 么 是 说 真 
柄 者 ， 要 么 是 说 假 话 者 。( 说 真 话 的 人 一 站 说 
真 话 ， 说 假 话 的 人 一 直 说 假 话 。) 那么 ， 你 怎 
样 同 一 个 人 只 问 一 个 问题 , 就 判断 这 个 人 是 说 
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和 真 话 者 ， 还 是 说 假 话 者 。 
请 概括 说 明 , 图 灵机 在 理论 计算 机 科学 领域 里 
的 重要 性 。 


. 请 概括 说 明 , 停机 问题 在 理论 计算 机 科学 领域 


里 的 重要 性 。 


. 假设 你 要 在 一 群 人 中 找 出 是 否 有 人 在 某 一 天 


过 生日 。 一 种 方法 就 是 对 这 群 人 中 的 成 员 一 人 
问 一 次 。 如 果 你 采用 这 种 方法 , 那么 出 现 何 种 
情况 会 让 你 知道 : 存在 这 样 一 个 人 在 那天 过 生 
日 ? 出 现 何 种 情况 会 让 你 知道 : 不 存在 这 样 的 
人 在 那天 过 生日 ? 现在 , 假设 要 找 出 至 少 一 个 
具有 某 种 特征 的 正 整数 , 你 可 以 应 用 同样 的 方 
法 对 整数 一 次 一 个 地 进行 系统 测试 。 事 实 上 ， 
如 宁 东 个 整数 具有 这 种 特征 , 你 会 怎样 将 它 找 
出 来 ? 然而 ， 如 果 没 有 整数 具有 这 样 的 特征 ， 
那 你 是 怎样 发 现 的 ? 为 了 确定 一 个 推测 是 否 
为 真 , 是 不 是 必须 得 与 确定 这 个 推测 是 否 为 候 
对 称 地 进行 测试 ? 


, 在 表 中 查找 某 个 值 的 问题 属于 多 项 式 问 题 


吗 ? 请 证 明 你 的 答案 。 


. 设计 一 个 算法 , 来 确定 给 定 的 一 个 正 整 数 是 否 


为 素数 。 你 的 解 是 否 高 效 ? 你 的 解 是 多 项 式 的 
还 是 非 多 项 式 的 ? 


: 一 个 问题 的 多 项 式 解 是 不 是 一 直 都 比 其 指数 


解 要 好 ? 请 说 明理 由 。 

一 小 问题 有 多 项 式 解 这 样 一 个 事实 , 是 否 就 意 
味 着 它 能 一 直 在 实际 可 行 的 时 间 内 求解 ? 请 
说 明理 由 。 

程序 员 查 理 要 解决 这 样 一 个 问题 : 将 一 个 组 


《人 数 为 偶数 ) 分 成 人 数 相同 的 两 个 小 组 ， 要 


使 得 每 个 小 组 的 总 年 龄 间 的 差别 尽 可 能 大 .他 
提出 的 解决 方案 是 : 先 构建 出 所 有 可 能 的 小 组 
对 , 计算 每 个 对 总 年 龄 间 的 差别 ,然后 选取 差 
别 最 大 的 那 一 对 。 但 是 , 程序 员 玛 丽 提出 的 解 


决 方案 是 : 首先 将 初始 组 按 年 龄 进行 排序 ,再 


分 成 两 个 小 组 ， 年 龄 较 小 的 一 半 为 一 组 ,， 年龄 
胃 大 的 一 半 为 另 一 组 ,每 种 解决 方案 的 复杂 性 
是 什么 ? 这 个 问题 本 身 是 属于 多 项 式 复杂 性 、 
NP 复 条 性 还 是 非 多 项 式 复杂 性 ? 

对 于 表 的 排序 问题 而 言 , 可 以 先生 成 出 表 的 所 
有 排列 ,然后 再 选 出 所 需要 的 那 一 个 排列 。 那 
人 么 请 问 , 为 什么 这 种 方法 不 是 一 个 令 人 满意 的 
方法 ? 

假设 一 种 彩票 基于 的 是 正确 选择 4 个 整数 值 ， 
每 个 值 的 范围 都 是 1 到 50。 并 假设 累计 奖金 已 
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经 大 到 对 每 种 可 能 的 组 合 分 别 买 一 张 彩 覃 都 
能 产生 利润 的 地 步 。 如 果 买 一 张 彩 票 要 花 一 
秒 钟 的 时 间 ， 那 么 为 每 种 可 能 的 组 合 都 买 一 
张 彩扩 得 花 多 长 时 间 ? 如 果 彩 票 需 要 选取 5 
个 数 ， 而 不 是 4 个 数 ， 那 么 所 需 时 间 将 如 何 变 
化 ? 依据 本 章 所 讨论 的 内 容 ， 这 个 问题 必须 
要 做 些 什 么 ? 

下 面 的 算法 是 确定 性 的 吗 ? 请 说 明理 由 。 
procedure mystery (Numben 


if (INumber > 5) 
then (回答 "yes”) 


else ( 挑 一 个 比 5 小 的 数 并 将 这 个 数 作为 答案 ) 


下 面 的 算法 是 确定 性 的 吗 ? 请 说 明理 由 。 
一 直 向 前 开 。 

在 一 个 路 口 问 站 

在 拐角 处 的 人 问 他 是 应 该 往 右 还 是 往 左 。 
根据 那个 人 指 的 方向 转弯 。 

开 两 个 区 ， 然 后 停 下 来 。 


请 确定 下 列 算 法 中 的 非 确 定 的 地 方 : 


选 1 到 100 之 间 的 3 个 数 。 
计 (如 果 所 选 数字 的 和 大 于 150) 
then (回答 "yes7) 
else (选择 已 选 出 的 数 中 的 一 个 ， 将 读数 作为 
答案 ) 


.下列 算法 是 具有 多 项 式 时 间 复杂 性 还 是 具有 


非 多 项 式 时 间 复 杂 性 ? 请 说 明理 由 。 


procedure mystery (ListOfNurmbers) 
从 ListOfNumbers 中 选 一 组 数 
if ( 庆 些 数 加 起 来 得 125) 

then (回答 "yes”) 

else (不 给 出 答案 ) 


以 下 间 题 中 ， 哪 些 问题 是 属于 P 类 的 ? 

a. 复杂 性 为 产 的 问题 

b. 复 滁 性 为 3 的 问题 

c. 复杂 性 为 m+28 的 问题 

d. 复 柔 性 为 由 il 的 问题 

概述 说 明 一 个 问题 是 多 项 式 问题 和 说 明 一 个 
问题 是 非 确 定性 多 项 式 问题 之 间 的 区 别 。 

请 举 出 一 个 问题 的 例子 ， 该 问题 既 属 于 P 类 ， 
又 属于 NP 类 。 


' 假设 给 你 两 个 算法 用 来 解决 同一 个 问题 。 一 个 


算法 的 时 间 复 杂 性 为 地 ,而 另 一 个 算法 的 时 间 


(LA 


《和 
he 


386 


4 


一 


二 2 


十 5. 


第 12 章 计算 理论 


复杂 性 为 4n, 那么 在 什么 样 规模 的 输入 上 前 者 
比 后 者 更 为 有 效 ? 


. 假设 要 解决 的 问题 是 旅行 商 问 题 , 其 中 所 涉及 


的 城市 数 为 15, 而 任 两 个 城市 之 间 只 有 一 条 路 
相连 .。 那么 请 问 , 遍历 这 些 城市 共有 和 多少 种 不 
辣 的 路 径 ? 这 里 假设 每 条 路 径 的 长 度 能 够 在 
一 徽 秒 内 计算 出 来 ,那么 计算 出 所 有 这 些 路 径 
的 长 度 要 花 多 长 时 间 ? 

如 果 将 归并 排序 算法 〈 见 图 12-9 和 图 12-8) 应 
用 到 才 Alice、Bob、Carol 以 及 David， 那 么 要 
做 多 少 次 名 字 比 较 ? 如果 应 用 到 表 Alice 、 

Bob、Carol]、David 以 及 Elaine， 那 么 又 将 做 多 
少 次 名 池上 比较? 


: 请 为 图 12-12 所 示 的 每 一 类 问题 都 举 出 一 个 


例子 。 


,设计 一 个 算法 ， 找 到 形 如 xz + 六 = "的 等 式 的 


定 你 的 算法 的 时 间 复 杂 性 。 

背包 问题 (kmapsack problem) 是 另 一 个 属于 NP 
完全 类 的 问题 。 该 问题 只 在 从 一 个 甫 中 找 出 一 
些 数 ， 使 得 这 些 数 的 和 等 于 某 个 值 。 例 如 ， 表 
石 吕 之 壹 号 了 771 了 上 站 35 了 了 82 3 卫 DD 级 

中 的 数据 项 2$7、388 和 782, 它们 的 和 为 1427。 
请 找 出 和 为 1723 的 数据 项 。 你 用 的 是 什么 算 
法 ? 其 复杂 性 又 如 何 ? 


- 请 指出 族 行 商 问题 与 背包 问题 的 相似 之 处 ( 见 


习题 4$) 。 


于 而 屿 = 站 让 
会 站 
全 上 器 题 
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下 面 的 表 排 序 算 法 称 为 冒 泡 排序 。 当 将 其 用 到 
一 个 有 m 个 数据 项 的 表 中 时 ， 导 泡 排 序 需 要 在 
表 项 中 进行 多 少 次 比较 ? 


procedure BubblesortIListy 
CoOunter 一 1: 
while (Counter < List 中 的 项 的 个 数 ) do 
[N 一 List 中 的 项 的 个 数 ; 
while (N >1) do 
(if(List 中 的 第 N 个 项 小 于 其 前 面 的 项 ); 
then( 第 N 个 项 和 前 面 的 一 项 交换 ) 
N 一 -1 
) 
] 


用 RSA 公 钥 加 密 技 术 对 报 文 110 进 行 加 密 ， 这 
里 心 钥 为 m=91 和 ee 和。 

用 RSA 会 钥 加 密 技 术 对 报 文 111 进 行 解密 ， 这 
里 秘 钥 为 m=133 和 d5。 

假设 你 知道 一 个 基于 RSA 算 法 的 公 钥 加 密 系 
统 ， 其 公 钥 为 上 = 77 和 e =7。 私 钥 是 什么 ? 和 
样 才能 让 你 在 一 个 合理 的 时 间 范 围 内 解决 这 
个 问题 ? 

找 出 107 531 的 因数 。 这 个 问题 与 本 章 的 内 容 
有 什么 关联 ? 

如 采 正 整数 m 在 2 到 m 的 平方 根 范围 内 没有 整数 
因子 , 那么 我 们 能 够 得 出 什么 结论 ”对 于 找 一 
小 正 整 数 的 因子 这 样 的 任务 来 说 , 这 又 能 告诉 
你 一 些 什么 ? 


下 面 的 问题 有 助 于 你 分 析 一 些 与 计算 领域 相关 的 伦理 、 社 会 和 法 律 问题 。 回 答 这些 问 题 不 
是 唯一 的 目的 ， 还 应 该 考虑 为 什么 这 样 回答 ， 
1. 假设 一 个 问题 的 最 优 算法 解 将 需要 执行 100 年 ， 那 么 你 会 认为 这 个 问题 是 容易 处 理 的 


吗 ? 为 什么 ? 


以 及 你 的 判断 是 否 对 每 个 问题 都 标准 如 一 。 


2 公民 有 权 在 免 受 政府 部 门 监控 的 情况 下 对 报 文 进行 加 密 吗 ? 你 的 回答 是 否 提供 了 “合适 
的 ”法 律 执行 ? 那么 谁 来 决定 “合适 的 ”法 律 执行 是 什么 ? 
3. 如 朱 人 脑 是 一 个 算法 设备 ， 那 么 关于 人 性 ， 图 灵 论 题 会 有 什么 结果 ? 到 怎样 的 程度 ， 你 


会 认为 图 灵机 包含 了 人 脑 的 计算 能 力 ? 


4. 我 们 已 经 看 到 ， 不 同 的 计算 模型 (如 有 限 表 、 代 数 公式 、 图 灵机 等 ) 有 不 同 的 计算 能 力 。 
不 同 的 生物 体 也 有 不 同 的 计算 能 力 吗 ? 不 同 的 人 的 计算 能 力也 不 同 吗 ? 如 果 是 这 样 ,， 那 
么 共有 较 高 能力 的 人 是 否 能 用 这 些 能 力 来 获得 更 好 的 生活 方式 ? 


5. 在 今天 ， 有 许多 网 站 提供 了 大 多 数 城市 的 交通 地 图 。 


这 些 站 点 能 够 帮助 寻找 某 个 具体 的 


地 址 ， 并 提供 变焦 功能 来 看 清 小 范围 的 街区 布局 。 从 这 个 事实 出 发 ， 考 虑 下 面 一 系列 的 
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假想 。 假 设 这 些 地 图 站 点 配备 了 具有 变焦 功能 的 卫星 拍照 技术 。 假 设 这 些 变焦 功能 增强 
刘 能 对 东 个 独立 的 建筑 及 其 周边 的 景象 给 出 更 为 详细 的 图 像 。 假 设 这 些 图 像 又 增强 到 包 
括 实 时 视频 。 假 设 这 些 实时 视频 图 像 通过 使 用 红外 线 技术 而 得 到 加 强 。 到 了 这 个 地 步 ， 
别人 就 能 够 一 天 24 小 时 地 监视 着 你 的 家 。 在 这 一 系列 技术 进步 中 ， 你 的 隐私 权 是 在 哪 一 
所 开始 受到 侵犯 的 ?在 这 一 系列 技术 进步 中 ， 你 认为 什么 事情 上 我 们 超越 了 当今 间谍 卫 
星 技术 的 能 力 ? 在 每 样 的 程度 上 ， 这 个 场景 就 只 是 假想 的 ? 

6. 假设 一 个 公司 开发 了 一 个 加 密 系 统 ， 并 取得 了 专利 权 。 政 府 机 构 是 否 有 权 以 国家 安全 的 
名 义 来 使 用 这 个 系统 ? 政府 机 构 是 否 有 权 以 国家 安全 的 名 义 限 制 这 个 公司 对 这 个 系统 
的 商业 使 用 ? 如 果 这 个 公司 是 跨国 公司 ， 那 么 情况 又 会 怎样 ? 

7. 假设 你 买 了 一 个 产品 ， 其 内 部 结构 是 加 密 的 ， 那 么 你 是 否 有 权 对 这 个 产品 的 基本 结构 进 
行 解密 ? 如 果 是 ， 你 是 否 有 权能 以 商业 方式 来 使 用 这 些 信息 ? 以 非 商业 方式 使 用 呢 ? 如 
朱 它 的 加 密 是 利用 一 个 秘密 的 加 密 系 统 来 实现 的 ， 而 你 发 现 了 这 个 秘密 ， 那 么 你 有 权 分 
享 这 个 秘密 吗 ? 

8. 一 些 年 以 前 , 哲学 家 约翰 杜威 (1859 一 1952) 提 出 了 “ 履 责 技术 ”responsible technology) 
这 个 术语 。 请 举 出 一 些 例子 ， 来 说 明 你 对 “ 履 责 技术 ”是 怎样 考虑 的 。 在 例子 的 基础 上 ， 
盖 明 你 自己 对 “ 履 责 技术 ”的 定义 。 在 过 去 的 100 多 年 里 ， 社 会 实践 了 “ 履 责 技术 ” 吗 ? 
应 当 采 取 措 施 来 保证 它 的 实施 吗 ? 如 果 是 , 则 应 采取 什么 样 的 措施 ? 如 果 不 是 ,为 什么 ? 
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ASCII 伍 


面 列 出 了 ASCI 码 的 一 部 分 ， 并 在 每 个 位 模式 的 左边 都 添加 了 一 个 0， 以 构成 现在 通 
用 的 8 位 位 模式 。 






















所 号 外 大 符号 ASCll 码 ASCII 码 

次 生 00001010 > 00111110 ^ 01011110 
回 车 00001101 ? 00111111 ~ 01011111 
空格 00100000 四 01000000 . a 01100001 
00100001 A 01000001 b 01100010 
" 00100010 B 01000010 C 01100011 
# 00100011 C 01000011 d 01100100 
$ 00100100 D 01000100 e 01100101 
9% 00100101 F 01000101 f 01100110 
& 00100110 F 01000110 g 01100111 
00100111 G 01000111 h 01101000 
00101000 H 01001000 01101001 
] 00101001 | 01001001 j 01101010 
# 00101010 J 01001010 k 01101011 
+ 00101011 K 01001011 | 01101100 
00101100 L 01001100 m 01101101 
00101101 M 01001101 n 01101110 
00101110 N 01001110 o 01101111 
/ 00101111 O 01001111 p 01110000 
0 00110000 P 01010000 q 01110001 
1 00110001 O 01010001 r 01110010 
2 00110010 月 01010010 s 01110011 
3 00110011 S 01010011 t 01110100 
4 00110100 下 01010100 u 01110101 
5 00110101 网 01010101 v 01110110 
6 00110110 V 01010110 WwW 01110111 
7 00110111 W 01010111 x 01111000 
8 00111000 X 01011000 Y 01111001 
9 00111001 Y 01011001 z 01111010 
00111010 z 01011010 { 01111011 
00111011 [ 01011011 ) 01111101 
< 00111100 \ 01011100 

00111101 01011101 


内 录 半 
处 理 二 进 制 补 码 表示 的 电路 


附录 介绍 用 二 进 制 补 码 表 示 的 值 进行 取 负 及 相 加 电路 。 我 们 从 图 B-1 的 电路 开始 ， 它 

将 一 个 4 位 的 二 进 制 补 码 转 换 为 该 值 的 负 值 的 表示 。 例 如 ,假设 给 出 3 的 二 进 制 补 码 表 
示 ， 该 电路 则 产生 -3 的 表示 。 算 法 与 正文 中 所 述 一 样 。 也 就 是 说 ， 它 自 右 向 左 复制 位 模式 ， 直 
至 复制 到 一 个 1， 然 后 将 剩 余 的 各 位 取 反 。 由 于 最 右边 XOR 门 的 一 个 输入 值 固定 为 0， 所 以 此 门 
只 能 将 其 另 一 个 输入 传送 至 输出 。 然 而 这 个 输出 又 向 左 传 给 下 一 个 XOR 门 作为 一 个 输入 。 如 果 
这 个 输出 是 1， 那 么 下 一 个 XOR 门 将 会 把 其 输入 位 取 反 后 送 给 输出 。 而 且 ， 这 个 1 还 会 通过 OR 
门 回 左 传送 ， 影 响 下 一 个 门 。 就 这 样 ， 复 制 给 输出 的 第 一 个 1 也 会 向 左 传送 ， 使 得 所 有 剩余 的 位 
在 送 到 输出 时 都 取 反 。 


输入 


钵 出 
图 B-1 将 一 个 二 进 制 补 码 位 模式 取 负 的 电路 
接 下 来 ， 我 们 考虑 一 下 用 二 进 制 补 码 表示 的 两 个 数值 的 加 法 。 具 体 而 言 ， 解 决 问题 


+ 0110 
二 荆 避 1 1 


时 ， 我 们 是 从 右 至 左 一列 一 列 地 计算 ， 并 且 每 列 都 执行 相同 的 算法 。 因 此 ， 只 要 获得 这 类 问题 
一 列 的 加 法 电路 ， 通 过 重复 这 个 单列 电路 ， 就 可 以 构建 许多 列 的 相 加 电路 。 

多 列 加 法 问题 中 一 个 单列 的 相 加 算法 是 这 样 的 ， 把 当前 列 的 两 个 数值 相 加 ， 把 相 加 的 和 加 
上 上 一 位 的 进位 ， 并 将 此 和 的 最 低 有 效 位 记 为 答 数 ， 然 后 将 进位 传 向 下 一 列 。 图 B-2 中 的 电路 遵 
循 这 个 算法 。 上 面 的 XOR 门 决定 了 两 个 输入 位 的 和 。 下 面 的 XOR 门 将 这 个 和 与 上 一 列 的 进位 相 


加 。 两 个 AND 门 及 OR 门 一 起 把 进位 向 左 传送 。 具 体 来 说 ， 如 果 该 列 中 最 初 的 两 个 输入 是 1， 或 : 


者 这 些 位 的 和 及 进位 都 是 1， 那 么 就 会 产生 一 个 进位 1。 

图 B-3 表 示 单 列 电路 的 副本 如 何 用 于 产生 计算 用 4 位 二 进 制 补 码 系统 表示 的 数值 和 的 电路 。 
图 中 每 个 矩形 表示 单列 加 法 电路 的 一 个 副本 。 需 要 注意 的 是 : 最 右边 矩形 的 进位 值 总 是 0， 因 为 
它 没 有 来 自 上 一 列 的 进位 。 以 此 类 推 ， 最 左边 矩形 产生 的 进位 将 被 忽略 。 
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列 的 上 列 的 下 
面 一 位 面 一 位 


向 下 一 


来 自 上 一 
人 列 的 进 人 


和 
图 B-2 在 一 个 多 列 加 法 问题 中 进行 单列 相 加 的 电路 


上 面 的 输入 下 面 的 输入 
1 广 进位 出 1 广 ， 
进位 入 进位 人 进位 入 进位 入 0 





和 
图 B-3 ”使 用 图 B-2 中 电路 的 4 个 副本 将 2 个 二 进 制 补 码 表示 的 数值 相 加 的 电路 


因为 进位 的 信息 目 最 右 同 最 并 传播 ， 或 者 说 波动 ， 所 以 图 B-3 电 路 称 为 行 波 加 法 器 (ripple 
adder)。 这 类 电路 尽管 结构 简单 ， 但 执行 速度 较 慢 ， 而 一 些 更 好 的 电路 版 本 ， 例 如 ， 先 行进 位 
加 法 器 ， 束 可 以 使 得 这 种 从 列 到 列 之 间 的 传播 减 到 最 小 。 于是， 尽管 图 B-3 中 的 电路 足够 满足 我 
600| 们 的 要 求 ， 但 并 不 是 当今 机 器 中 使 用 的 电路 。 


人 
一 种 简单 的 机 器 语言 


附录 介绍 一 种 简单 却 有 代表 性 的 机 器 语言 。 我 们 首先 解释 一 下 这 一 机 器 本 身 的 体系 
结构 。 


| 本寺 症 下 汪 时 和 全 汪 于 全 寺 扯 让 下 村 估计 伍 < 几 下 后 二 网- 辣 贡 和 时 rr 下 ra 0 下 二 本 用 二 二 SHE 


C.{ 机 器 体系 结构 


这 种 机 器 有 16 个 通用 寄存 器 ， 编 号 为 0 到 FE〈 十 六 进 制 表示 )。 每 个 寄存 器 的 长 度 为 1] 字 节 《〈8 
位 )。 为 了 在 指令 中 标识 寄存 器 ， 每 个 寄存 器 被 赋予 了 唯一 的 4 位 模式 ， 用 于 代表 其 寄存 器 号 。 
于 征 ， 千 他 器 0 由 0000《〈 十 六 进 制 0) 标识 ， 寄 存 器 4 由 0100〈 十 六 进 制 4) 标识 。 

机 器 主 在 中 有 256 个 单元 ， 每 个 单元 被 赋予 一 个 范围 在 0 到 255 之 间 的 整数 地 址 。 因此 ， 一 个 
地 址 可 以 表示 为 从 00000000 到 11111111《〈 或 者 是 在 00 到 FF 的 一 个 十 六 进 制 值 ) 的 一 个 8 位 模式 来 
表示 。 

假设 序 点 数值 以 1.7 节 讨论 过 并 且 概 括 在 图 1-26 中 的 8 位 格式 存储 。 


琵 抽 和 生 可 本- 是 生生 天国 9 革 各 于 于 同和 症 和 和 克 本 人 让 关机 rr 辐 村 本 于 和 有 本 Pi 本- 


C.2 机 器 语言 ” 


每 条 机 器 指令 都 是 2 字 节 长 : 前 面 的 4 位 是 操作 码 ， 后 面 的 12 位 组 成 操作 数字 段 。 下 面 的 雪 
格 列 出 了 用 十 六 进 制 记 数 法 表示 的 指令 及 简要 说 明 。 字 母 R、 S 及 T 在 表示 寄存 器 标识 符 的 那些 
字段 处 用 来 替代 十 六 进 制 数字 ， 并 且 因 指令 的 具体 应 用 而 异 。 字母 X 及 Y 用 来 在 变量 字段 替代 十 
六 进 制 数字 ， 而 不 是 代表 寄存 器 。 


操作 码 操作 数 说 了 明 
1 RXYT 以 地 址 XY 的 存储 单元 中 找到 的 位 模式 装载 (LOAD) 寄存 器 及 
例 :， 14A3 将 使 得 地 址 为 A3 的 存储 单元 的 内 容 放 人 寄存 器 4 
2 RXY 以 忆 模 式 XY 装 载 (LOAD) 寄存 器 R 
例 : 20A3 将 使 得 数值 A3 放 人 和 寄存 器 0 
3 及 XY 将 寄存 器 R 中 的 位 模式 存放 〈STORE) 在 地 址 为 XY 的 存储 昔 元 中 
例 : 35B1 将 使 得 寄存 器 5 中 的 内 容 放 入 地 址 为 Bl 的 存储 童 元 
4 DRS 将 寄存 器 R 中 的 位 模式 移入 (MOVE) 寄存 器 S 
全 :40A4 将 使 得 寄存 器 A 的 内 容 复制 到 寄存 器 4 
5 RST 人 (ADD) ， 求 和 结果 存放 
民 
例 : 5726 将 使 得 寄存 器 2 和 寄存 器 6 中 的 二 进 制 数值 相 加 ， 并 将 针 果 存放 在 寄存 器 7 
6 RST 关羽 雪 二 和 (ADDJ) ， 并 将 浮 点 结果 存放 
有 


例 ， 634E 将 使 得 寄存 器 4 和 寄存 器 E 中 的 浮 点 值 相 加 ， 并 将 结果 存放 在 寄存 器 3 
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操作 码 操 作 
了 民生 工 
名 RST 
身 RST 
真 及 上 口 总 
下 及 总 和 
和 000 


一 种 简单 的 机 器 语言 


续 ) 





数 说 明 

将 寄存 器 $ 及 寄存 器 T 中 的 位 模式 做 或 〈《OR) 把 作 ， 并 将 结果 存放 在 寄存 器 民 中 

例 ，7CB4 将 使 得 寄存 器 B 和 寄存 器 4 的 内 容 做 或 操作 ， 结 果 存 放 在 寄存 器 C 中 

和 将 寄存 器 S 及 寄存 器 T 中 的 位 模式 做 与 (AND) 操作 ， 并 将 结果 存放 在 寄存 器 R 

例 ，8045 将 使 得 寄存 器 4 和 寄存 器 5 的 内 容 做 与 操作 ， 绪 果 存 放 在 寄存 器 0 中 

将 寄存 器 S 和 寄存 器 T 中 的 位 模式 进行 异 或 (EXCLUSIVE OR) 操作 ， 并 将 结果 人 存放 
在 寄存 器 R 中 

例 ， 95F3 将 使 得 寄存 器 F 和 寄存 器 3 的 内 容 进 行 异 或 操作 ， 结 果 存 放 在 在 寄存 器 5 中 

将 寄存 器 R 中 的 位 模式 循环 【ROTATE) 右 移 一 位 ， 进 行 X 次 。 每 次 都 把 低位 端 开始 
的 那个 位 放 人 高 靖 

例 ，A403 将 使 得 寄存 器 4 中 的 内 容 循环 右 移 3 位 

如 果 寡 存 器 R 中 的 位 模式 等 于 寄存 器 0 中 的 位 模式 ， 那 么 转移 《JUMP) 到 位 于 地 址 
XY 的 存储 单元 中 的 指令 。 否 则 ， 继 续 正常 的 执行 顺序 〈 转 移 是 通过 在 执行 周期 将 XY 
复制 到 程序 计数 器 来 实现 的 ) 

例 : B43C 将 首先 比较 寄存 器 4 和 寄存 器 0 中 的 内 容 。 如 果 二 者 相等 ， 则 把 模式 3C 放 人 
程序 计数 器 ， 所 以 下 一 条 执行 的 指令 将 是 这 个 存储 地 址 中 的 那 条 。 理 则 ， 不 做 任何 事 
情 ， 程 序 将 照常 继续 


停止 (HALT) 执行 








高 级 编程 语言 


7 水 包含 了 在 第 6 章 中 作为 例子 使 用 的 每 种 语言 的 简要 背景 





Ada 语 言 是 根据 奥 古 斯 塔 . 艾 达 . 拜 伦 (Augusta Ada Byron) (1815 一 1851) 命名 的 。 她 是 
查尔斯 . 巴 贝 奇 《Charles Babbage) 的 拥护 者 ， 诗 人 拜 伦 勋 表 〈Lord Byron) 的 的 女儿 。 这 个 语 
言 最 初 是 由 美国 国防 部 开发 的 ， 目 的 是 为 了 得 到 一 个 满足 其 所 有 软件 开发 需要 的 单一 的 通用 语 
言 。 在 Ada 的 设计 期 间 ， 一 个 重点 是 加 入 实时 计算 机 系统 编程 的 特性 ， 这 类 系统 利用 来 作为 更 
大 机 器 的 一 部 分 ， 诸 如 导弹 遥控 系统 、 楼 际 间 的 环境 控制 系统 以 及 汽车 和 小 型 家 用 电器 中 的 控 
制 系 统 。 因 此 ，Ada 语 言 包 含 这 样 一 些 特征 : 既 可 以 表达 并 行 处 理 环境 中 的 活动 ， 又 可 以 作为 
合适 的 技术 解决 在 应 用 环境 中 出 现 的 特殊 情况 ( 称 为 异常 )。 尽 管 初 期 是 作为 命令 式 语 言 设 计 的 ， 
但 Ada 的 新 版 本 中 包含 了 面向 对 象 范 型 。 

Ada 语 言 的 设计 一 贯 强调 可 导致 可 靠 软件 高 效 开 发 的 特性 ， 这 个 特性 被 这 个 事实 例证 了 : 溢 
音 777 飞 机 中 所 有 内 部 的 控制 软件 都 是 用 Ada 语 言 编 写 的 ， 这 也 是 Ada 用 作 SPARK 语 言 开 发 《正如 
第 5 章 中 说 明 的 ) 的 起 始点 的 主要 诛 因 。 


D.2 C 语 言 


C 语 言 在 20 世 纪 70 年 代 初期 由 贝尔 实验 室 的 Dennis Ritchie 开 发 。 尽 管 它 最初 是 作为 开发 系 
统 软 件 的 语言 来 设计 的 ,但 却 在 程序 设计 界 颇 为 流行 , 并且 已 经 被 美国 国家 标准 化 组 织 标准 化 。 
C 语 言 最 初 的 设想 只 是 跨 出 机 器 语言 的 一 步 而 已 。 所 以 与 使 用 完整 的 英语 词汇 的 其 他 高 级 
语言 相 比 ， 它 的 语法 十 分 简洁 ， 原 语 都 用 专门 符号 表示 。 它 的 这 种 简练 性 使 得 复杂 算法 的 表达 
效率 很 高 ， 也 是 其 广 为 流 行 的 一 个 主要 原因 。( 通 常 说 来 ， 简 洁 的 表示 比 元 长 的 表达 更 易 读 。) 


| 





C++ 语言 由 贝尔 实验 室 的 Bjarne Stroustrup 开 发 ， 它 是 作为 C 语 言 的 一 个 加 强 版 本 开发 的 。 目 
的 是 开发 一 种 可 以 与 面向 对 象 范 型 相 兼容 的 语言 。 当 今 ，C++ 赁 其 自身 的 实力 已 经 成 为 显 着 的 
面向 对 象 语言 ， 同 时 它 还 作为 另外 两 种 主要 面向 对 银 语 言 开 发 的 起 始点 : Java 和 C#。 


于 让 全 贡生 关于 二 有 于 寺 汪 二 下 下 HE 二 可 和 JE 让 寺 下 十 全 村 有 生生 下 二 贡生 相克 主人 让 相生 牛人 生生 和 二 入 和 各 天 


D.4  C# 刘 言 
c# 语 言 是 由 微软 公司 开发 的 NET 框 架 中 的 工具 。 这 是 用 于 运行 微软 系统 软件 的 机 器 开发 应 
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用 软件 的 一 个 综合 系统 。 如 图 D-4 中 所 示 的 示例 ，C# 语 言 程 序 看 起 来 很 像 C++ 或 Java 程 序 。 事 实 
上 ， 微 软 公 司 将 C# 语 言 作为 一 种 不 同 的 语言 来 推介 并 不 是 因为 它 是 一 种 全 新 的 语言 ， 而 是 因为 
它 可 以 根据 自己 的 需要 改制 语言 的 一 些 专门 特性 , 而 不 必 涉 及 已 为 其 他 语言 所 接受 的 标准 问题 ， 
也 不 需要 考虑 其 他 会 司 的 专利 权 问 题 。 因 此 ，C# 语 言 的 创新 性 在 于 : 它 在 利用 .NET 框 架 开发 软 
件 中 所 扮演 的 角色 是 一 种 出 色 的 语言 。 拥 有 微软 公司 的 支持 ， 在 未 来 的 几 年 里 ，C# 以 及 .NET 框 
架 - ee 


站 0 和 生生 站 -有 


D. 5 _Fortran 语 语言 


FORTRAN 和 是 FORmula TRANslator (会 式 翻 译 语言 ) 的 缩写 词 。 该 语言 是 第 一 批 开 发 的 高 
级 语言 之 一 〈 公 布 于 1957 年 )， 并 且 是 计算 界 中 最 先 获得 广泛 认同 的 语言 之 一 。 多 年 以 来 ， 它 的 
正式 描述 经 历 了 许多 次 的 扩充 ， 也 就 是 说 ， 今 天 的 FORTRAN 语 言 与 原始 的 版 本 有 很 大 的 不 同 。 
事实 上 , 通过 学 习 FORITRAN 语 言 的 演变 ， 人 们 能 见证 研究 对 程序 语言 设计 产生 的 影响 。 尽 管 最 

初 是 设计 成 一 种 指令 语言 ， 但 FORIRAN 的 新 版 本 现在 已 经 包含 了 许多 面向 对 象 特性 。 
FORTRAN 语 言 在 科学 界 仍然 是 一 种 很 流行 的 语言 。 具 体 来 说 , 许多 数值 分 析 以 及 统计 软件 包 都 
是 使 用 FORIRAN 语 言 编写 的 ， 而 且 仍 将 继续 用 FORTRAN 语 言 编 写 。 图 D-5 表 示 了 使 用 

CI 的 一 个 示例 程序 。 


站 和 于 囊 关 二 生硬 二 下 五 二 外 各 全 全 本 丰 村 国庆 半 册 丧 疝 宁可 站 再生 ET 本 有 各 生生 和 让 站 证 时 | 二 ， 丽 生生 二 未 寺 玫 寺 PEEREEAUENHT HH 利 M 时 生计 aaa 和 rd 


D. 6 Java 语 


Java 语 言 是 Sun 公 司 在 20 世 纪 90 年 代 早期 开发 的 一 种 面向 对 象 语 言 。 该 语言 的 设计 者 在 很 大 
程度 上 沿 可 了 C 语 言 以 及 C++ 语言 。Java 引 起 的 振奋 不 是 由 于 语言 本 身 ， 而 是 由 于 该 语言 的 通用 
实现 性 以 及 在 Java 编 程 环境 中 大 量 预 先 设计 好 的 模板 .通用 实现 性 指 的 是 用 Java 语 言 编写 的 程序 
能 够 在 大 范围 的 机 器 上 有 效 地 执行 ,模板 的 可 用 性 意味 着 复杂 软件 能 相对 比较 容易 开发 出 来 。 

例如 ，applet《〈 小 应 用 程序 ) 及 servlet〈 小 服务 程序 ) 使 得 万 维 网 软件 的 开发 更 加 流畅 。 
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本 附录 中 , 我 们 使 用 第 11 章 中 的 Bare Bones 语 言 作为 工具 来 回答 第 4 章 中 提出 的 关于 选 

十 必 全 网 与 递归 结构 熟 更 有 效 的 问题 。 回 想 -一 下 ; Bare Bones 语 言 只 包含 3 个 赋值 语句 

(clear、incr 以 及 decr) 和 一 个 控制 结构 (由 while-end 语 句 对 构成 )。 并 且 这 种 简单 的 语言 与 图 

灵机 具有 相同 的 计算 能 力 ;， 因此 ， 如 果 我 们 接受 了 丘 奇 - 图 灵 论 题 ， 就 可 以 得 出 结论 : 任何 具有 
算法 解 的 问题 都 有 可 用 Bare Bones 表 达 的 解 。 

兴 代 结构 与 递归 结构 进行 比较 的 第 一 步 是 将 Bare Bones 语 言 的 先 代 结构 替换 成 递归 结构 。 
方法 如 下 : 将 while 和 end 语 句 从 该 语言 中 移出 ， 并 在 它们 的 位 置 提供 可 以 把 Bare Bones 程 序 分 成 
部 分 单元 的 能 力 ， 以 及 可 从 程序 其 他 地 方 调用 这 些 单元 之 一 的 能 力 。 严格 地 说 ， 我 们 建议 用 修 
改 后 的 语言 编写 的 每 个 程序 是 由 许多 语法 上 分 离 的 程序 单元 构成 。 假定 每 个 程序 必须 正好 包含 
严格 称 为 MAIN 的 单元 ， 它 的 语法 结构 如 下 : 


MAlIN: begin; 


e 站 dd， 


(其 中 点 表示 其 他 Bare Bones 语 句 ) 也 可 能 包括 其 他 年 元 (语法 上 从 属于 MAIN)， 具 有 如 下 结构 : 


2 二 Degln， 


区 [607 
Cani 表 示 单 元 的 名 称 ， 与 变量 名 具有 相同 的 语法 。) 这 种 分 割 结构 的 语义 是 : 程序 总 是 从 MAIN 
单元 的 开头 开始 执行 ， 并 且 在 到 达 该 单元 的 end 语 名 时 停止。 除了 MAIN 之 外 的 程序 单元 都 可 以 
通过 条 件 语 名 


if name not 0 perform 2 


作为 过 程 来 调用 (其 中 mame 表 示 任 何 变量 名 ，WwAz 表示 除了 MAIN 之 外 的 其 他 任何 程序 单元 名 )。 
而 且 ， 还 允许 MAIN 单 元 之 外 的 其 他 单元 递归 地 调用 目 己 。 

有 了 这 些 附加 的 特性 ， 我 们 就 可 以 模拟 原来 Bare Bones 中 的 while-end 结 构 了 。 例 如 ， 一 个 
如 下 形式 的 Bare Bones 程 序 : 


while X not 0 do; 
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到 门 器 
《其 中 全 示 任何 Bare Bones 语 句 的 序列 )， 它 可 以 被 如 下 单元 结构 替代 ;: 


MAIN:，begini: 
于 Xmnot Operform unitA: 
站 对: 


UnitA: begin: 
届 
iiXnot0 perform UnitA; 
return， 


因此 ， 我 们 得 出 结论 ， 修 改 后 的 语言 具有 原始 Bare Bones 语 言 的 所 有 能 力 。 

也 可 以 说 明 ， 任 何 使 用 修改 后 语言 解决 的 问题 都 〈 也 能 够 ) 用 Bare Bones 来 解决 。 做 到 
这 一 点 的 一 种 方法 就 是 说 明 任何 用 修改 后 语言 表达 的 算法 都 可 以 用 原始 的 Bare Bones 语 言 
编号。 不过， 这 涉及 递归 结构 如 何 用 Bare Bones 语 言 的 while-end 结 构 来 模拟 的 一 个 比较 精 
确 的 描述 ? 

对 于 我 们 的 目的 ， 比 较 简 单 的 就 是 根据 第 11 章 所 介绍 的 丘 奇 -图 灵 论 题 。 具 体 来 说 ， 丘 奇 - 
图 无 论题 ， 加 上 Bare Bones 与 图 灵机 器 具有 相同 的 能 力 这 个 事实 ， 表 明了 没有 比 原 始 Bare Bones 
更 强 能 力 的 语言 了 。 所 以 ， 任 何 可 以 用 我 们 修改 后 的 语言 求解 的 问题 也 能 用 Bare Bones 解 决 。 

我 们 得 出 的 结论 是 , 修改 后 语言 的 能 力 与 原始 Bare Bones 一 样 。 两 种 语言 之 间 的 唯一 区 别 是 ， 
一 种 提供 的 是 迭代 控制 结构 ， 而 另外 一 种 提供 的 是 递归 控制 结构 。 因 此 ， 实 际 上 这 两 种 控制 结 
构 在 计算 能 力 上 是 等 价 的 。 
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Interrupt handler〈 中 断 处 理 程 序 )，136 Kilobyte (于 字 节 )，30 
Intractable problem 《问题 )，581 有 inematics，496 
Intranet【〈《 内 联网 )，163, 164 Kineographs，494 
Iowa State College 〔〈University)〈 艾 奥 瓦 州立 大 学 )，7 Knapsack problem 《〈 背 包 问 题 )，592 
下， 见 Internet Protocol Kormm shell，129 
IP address《 下 地址 )，165 
IP addresses，165 L 
IPv4 【版 本 为 4 的 了 7) 188 LAN， 见 Local area network 
IPv6【 版 本 为 6 的 IP) 188 Language extensions《 语 言 扩 展 )，266 
IQ test《IQ 训 试 1)，545 Last in, first out 《LIEO)I《 后 进 先 出 )，373 
IRobot 有 Roomba vacuurm cleaner， 543 Latency time 【等 竺 时间)，32-33 
ISO， 见 International Organization for Standardization Layered approach to Internet software，181-186 
Isotropic surfaces【〈 迁 代 综 枸 )，480-481 Leaf node《【 叶 子 结 点 )，374 
ISP， 见 intermet service Provider Least significant bit《 最 低 有 效 位 )，28 
Iterative model ( 迁 代 模型 )，334 Left child pointer 〔 左 子 指针 )，389 
Iterative suructures 《 选 代 结构 )，222-231, 607 Leibniz, Gottfried Wilhelm ( 戈 特 弗 里 德 . 威 尔 赫 尔 姆 . 莱 
TIverson, 此 ennmeth 下 .， 之 7 布 尼 蔬 )，5 
Lempel, Abraham，64 

J Lempel-Ziv-Welsh encoding 〈《LZW 编 码 )，64 
Jacquard, Joseph〈 约 瑟 夫 ' 雅 卡 尔 ) ，6-7 Leonardo da Vinci， 96 
Jacquard loom【《【 雅 卡尔 织 布 机 )，6-7 Lexical analysis 【词法 分 析 )，293 
Java，180, 271, 272, 274-276, 278, 279, 281, 282, 294, 302， Lexical analyzer 《词法 分 析 器 )，293 

306, 309, 343, 380, 404, 405, 606 Lg 【logarithm base two)《【《 以 2 为 底 的 对 数 )，244, 579 
JavaBeans，344 Liability ，364 
JavaScript，180 Life lne，330 
JavaServer Pages〔〈JSP) (Java 服务 器 页 面 )，180 . LIFO， 见 Last in, first out 
Job Control Language (JCL) 《作业 控 制 语 言 )，123 Light-surface jinteraction 〈 光 一 表面 交互 )，479 
Job 【作业 )，123 Line feed【〈 换 行 )，168-169 
Job control languages《〈 作 业 控 制 语 言 )，272 Linear algebra《 线 性 代数 )，72 
Job queue 《作业 队列 )，123 Linguistics〈 语 言 学 )，506, 507 
Jobs, Steve【〈《 史 蒂 夫 :天 布 斯 )，8 Link layer 《Internet) 《因特网 链 路 层 )，182-183,，185 
JOIN (database operation) 《连接 运算 〔〈 数 据 库 运算 ))， Linux，122, 128 

430-433 LISPE，268 
Joint Photographic Experts Group 〔 联 台 图 像 专家 组 )，6 List【〔〈 表 )，372 
JPEG 〈 联 合 图 像 专家 组 )，6 抑 -66 contiguous《 邻 接 表 )，384 
JSP， 见 JavaServer Pages linked〈 链 表 )，384 
Just-in-time compilation 《及时 编译 )，294 Literal (字面 量 )，277 

Load balancing 《负载 平衡 )，125 

KK Load factor (hash file)【〔 负 载 因子 〈 散 列 文件 ))，451 
肛 B， 见 Kilobyte Local area network (LAN)《【 局 域 网 )，152 
KB， 见 Kilo-bps Local lighting model《〈 局 部 照明 模式 )，489 
Kermel《 内 核 )，129 Local variables《“《 局 部 变量 )，285 
Key 《cryptographyy《〈 密 铀 《密码 学 ))，193 Lockheed Martin，251 
Key field【〈《 键 字段 )，36, 445, 448 Locking protocol (锁定 协议 )，441-442 
Key frames 〈 关 键 帧 )，494 Logarithm 《base 2)【〔〈 以 2 为 底 的 对 数 )，244 
Key record 【关键 记录 )，447 Logic programming 〈 远 辑 程序 设计 )，268, 314, 532 
Key words 【天 键 字 )1，294 Logical cohesion 〈 逻 辑 内 聚 )，341 


Kibi《〈《 约 干 位 )，30 Logical deduction 逻辑 推理 )，312-314, 518 
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Logical record ( 贤 辑 记录 )，36 Mark TI【( 马 殉 一 号 )，7, 249 
Logical shift〈 肥 辑 移 位 )，102 Markup language《 标 记 语言 )， 178 
Login 《登录 )，143 Mars Exploration 有 overs，1235 
Long division algorithm 【长 除法 )，2, 206 Mask《〈 撞 码 )，100 
Look and feel 【界面 外 观 )，363 Masking (屏蔽 )，100 
Lookahead carry adder 《先行 进位 加 法 器 )，600 Mass storage 【〔 海 量 存 储 器 )，30-31 
Loop (循环 )，224-227 Master file《 主 文件 )，445 
Loop invariant《 循 环 不 变 式 )，250 Matrix theory《〈 和 矩阵 理论 )，72 
Loop stmuctures【〈 循 环 结构 )， 见 iteratice structures Mauchiy, John 约翰 : 莫 奇 利 )，8 
ZLord or tie 只 jing (〔film trilogy)，497 MB ， 见 Megabyte 
Lossless compression 〈 无 损 压 缩 )，62 Mbps， 见 Mega-bps 
Lossless decomposition 〔 无 损 分 解 )，428 MecCarthy, John 〔 约 朝 麦卡锡 )，508 
Lossy compression 【有 损 压 缩 )，62 MD5 (message-digest algorithm 5 的 缩写 )，450 
Lost update problem 〈 更 新 丢失 问题 )，441 Mebi〈 欧 兆 位 )，30 
Lotus 1-2-3，363 Mega-bps 《Mbps)【 百 万 比特 /种 )，68, 109 
Lotus Development Corporation (Lotus 开 尼 会 司 )，363 Megabyte【《 兆 字 市 ) 29 
Loveless, Ada，6 Megahertz《【《 兆 赫 )，29-30 
Low-order end 〔〈 低 位 端 )，28 Member function 〈 成 员 冰 数 )，303 
Luminance 〈 亮 度 )，41 Memory leak 《内 他 港 路)，398 
Memory manager 〔 内 存 管理 程序 )，131 
M Memory mafped IO 《〈 存 储 映 射 7O)，107 
Mac 0S，122 Merge algorithm 《归并 算法 )，446 
Machine cycle〈 机 器 周期 )，92 Merge sort algorithm 【〔〈 归 并 排序 算法 )，234, 577 
Machine independence 《机 器 无 关 )，264 cotmplexity of 【复杂 上 度 )，577 
Machine instructions (机 器 指令 )，85, 601 Meta-reasonjing 〈 元 推理 )，5$29 
AND (与 )，86 Method 《方法 )，270, 302-303 
ADD【〔 加 )，91, 102-103 Metrics 度量 学 )，327 
BRANCH 【分 吉 )，87 Mietropolitan area network (MAN ) ( 城 域 网 )，152 
HALT 【停止 )， 忠 Microprocessors 〔 徽 处 理 器 )，82 
ULO《〈 输 入 /输出 )，86, 107 Microsecond【 微 秒 )，116 
interrupt disable《 中 断 屏蔽 )，139 Microsoft Corporation (微软 公司 ) 8, 42, 122, 125, 139, 162， 
interrupt enable【 中 断 允 许 )，139 169. 180, 272, 286, 294, 344, 353, 425, 489, 605 
JUMP 转移 )，87, 93, 279 MIDI， 见 Musical Instrument Digital Interface 
LOAD 《加 载 )，86, 90, 106-107 Millisecond 【毫秒 )，33 
DOR (或 )，86 MIMD 《和 儿 指令 流 多 数据 冰 ) 111 
ROTATE 【〈 循 环 穆 位 )，86 MIME (Multipurpose Intermet Miail Extensions)， 167 
SHIFT 〔 称 位 )，86 ”Mod〈 取 模 )，586 
STORE (存储 )，86, 88-89, 106 Modeling 〈 建 模 )，469 
Test-and-set【〈《 测 试 并 置 位 )，139 Modem (调制 解 调 器 )，109, 164 
XOR (exclusive or)【〈 异 或 )，86 . Meodular notation 【 模 表 示 法 )，586 
Machine language〈 机 器 语言 )，85, 406-409, 601 Modularity 《模块 化 )，336 
Macromedia，180 Module 〈 模 志 )?，213，336 
Magnetic diskK【〈 磁 盘 )，31 ”Mondrian, Piet《 皮 耶 : 蒙 德里 安 )，240 
Magnetic tape〔〈 磁 带 )，33-34 Monitor 〔 监 控 程 序 )，311 
Mail server〈 邮 件 服 务 央 )，167-168 Moore School of Engineering 〈 葛 尔 电 子 工 程 学 院 )，8, 96 
Main memory 〔〈 主 存储 髓 )，27 Morphing 《融合 )，493 
Malware《〈 亚 意 软 件 )，188-189 Mosaic Software 〔Mosaic 软 件 公司 )，363 
MAN， 见 Metropolitan area network Most significant bit《 最 吉 有 效 位 )，28 
Manchester encoding 〈 曼 彻 斯 特 编码 )，156 Motherboard (主板 )，82 
Mantissa field (尾数 域 )，58-60 Motion capture【《 运 动 捕 握 )，496 


Many-to-many relationship【《 多 对 多 联系 )，349 Motion Picture Experts Group 〈(MPEBG) 【运动 图 像 专家 组 )，67 
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Meotorola 《摩托 罗拉 个 司 )，85 

Mouse【《 导 标 )，128 

ME3 (MPEG layer3 的 缩 写 )，67 

MPEG， 见 Motion Picture Experts Group. 

MS-DOS，129 

Multi-core CPU 多核 CPU)，112 

Multicast《 款 路 广播 )，170-171 

Multiplexing《 雪 路 复 用 技术 )，109 

Multiprogramming 〈 多 道 程序 设计 )，124 

Muiltitasking 多 任务 )，125 

Music, iterative structures in 《音乐 中 的 选 代 结 枸 )，230 

Musical Instruments Digital Interface (MIDI) 【乐器 数 
字 化 接口 )，43 

Mutual exclusion 【 互 斥 )，140 

MySQOL，434 
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N-unicast《 多 点 传播 )，170 

Name server 【名字 服务 器 )，166 

NAND 【与 非 )，27 

Nanosecond【 纳 秒 )，33 

NASA Mars rover (( 美 国 ) 国家 航空 航天 局 火星 控 路 者 )， 
543 

National Security 上 Agency U.S3.，251 

Natural language processing{ 自然 语言 处 理 ), 506, 507, 512 

Natural languages (自然 语言 )，265 

NET (.NET Framework)〈.NET 框 架 )，162, 343, 353, 605 

Netscape Communications, Inc.【 网 景 通信 公司 )，180 

Network (网 络 )，152-153 

Network layer〈Internet)《 因 特 网 网 络 屋 )，182, 184-185 

Network topologies【 网 络 拓扑 结构 )，153 

Neural network (biological) 【神经 网 络 )，112, 533 

Neuron，112，333 

Newton, Isaac【( 艾 萨 现 ' 牛顿 )，327 

NIL pointer (NIL 指 针 )，384 

Node ( 结 点 )，374. 517 

Nondeterministic algorithm 〔〈 不 确定 性 算法 )，205, $82 

Nondeterministic polynomial (NP)? problems【 非 确定 性 多 
项 式 问 题 )，583 

Nondisclosure agreement【〈 保 密 协议 )，364 

Nonloss decomposition 〈 无 损 分 解 )，428 

Nonterminal ( 非 终结 符 )，295 

NOR 〔 或 非 1，26-27 

Normal (法 线 )，479 

Normal vectors (法 向 量 )，487 

Normalized form 《规范 化 形式 )，59-60 

NOT (〈 非 )，21 

Novell Imec. 【Novell 公 司 )，152 

NP-complete problem (NP 完 全 问题 )，583 

NP problems (NP 问 题 )， 见 Nondeterministic polynomial 
problermns 


NULL pointer《〈《 空 指针 )，384 
Numerical analysis〈 数 值 分 析 )，61 
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Object〈 对 象 )，270, 301-305, 469 

Object-oriented database 〈 面 向 对 象 数据 库 )，436 

ODbject-oriented paradigm【《 面 问 对 象 范 型 )，270, 336, 343， 
345，34 

Object-oriented programming(OOP) (面向 对 象 程序 设计 )》， 
之 1 

DObject program《 目标 程序 )，293 

Odd parity 〈 奇 校 验 )，69 

Off-line《【《 脱 机 )，31 

On-line《【《 联 机 )，31 

ODne-to-many relationship 〈 一 对 雪 联 系 )，349 

One-to-one Telationship (一 对 一 联系 )，348 

ODP， 见 Dbject-oriented priograrmining 

Op-code 《操作 码 )，88 

Open (file operation)(《 打 开 【 文 件 操作 )7，130 

Open Graphics Library 〈 吕 penGL )，489 . 

Dpen metworkk 《开放 式 网 络 )，152 

Open-source development【〈 开 放 源 码 开 发 )，335 

Open System Intercomnect (OSI) 〔 开 放 系 统 互 连 )，186 

Operand 〈 操 作 数 )，88-90 

Operating system 【操作 系统 )，122 

O 〇 Operator precedence【〈 运 算 符 优先 级 )，279 

Optical zoom 【光学 变焦 )，41 

DR 【〈 或 1，24, 100, 101 

Orwell, Deorge 《Eric Blair)，17 

DSI， 见 Open System Interconnect《 开 放 系 统 互 连 )， 

OSI reference model (OSI 参考 模型 )，186 

Outler analysis《 扳 立 点 分 析 )，453 

Overflow eror《〈 滥 出 错误 )，53-54 

Overloading【〈 重 载 )，279 
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P， 见 Polynomial problems 
P2P， 几 Peer-to-peer model 
Packet 〈 分 组 )，184-185 


Packing together， 才 73 


Page 《memory (页面 《内 存 ))，131 
Paging 〈 页 面 调 度 )，131 

Paint (drawing software systemyj，42 
Painter's algorithm 〔〈 并 行 算 法 )，485 
Piam OOS，125 

PlamSource, Inc.,， 125 

Parallel algorithm 〔〈 并 行 算法 )，205 
Parallel communication 《并 行 通 售 )，108 
Parallel processing 《并 行 处 理 )，111, 309 
Parallel projection 【平行 投影 )，467 
Parameter 【和 参数)，213, 287 
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Passed by reference《〈 技 引用 传递 )，289 
passed by value《 按 值 传 递 )，288 
passed by value-result〈 按 值 -结果 传递 )，320 
Parent node【〔 父 结 点 )，375 
Pareto principlje【 帕 累 托 法 则 )，355 
Pareto, Vilfredo【〈 维 夫 雷 雪 ， 帆 绒 托 )，355 
Parity bit《 奇 偶 校 验 位 )，69 
Parse tree〈 语 法 分 析 树 )，296 
Parser 《语法 分 林 器 )，293 
Parsing 【语法 分 析 )，293 
Particle systems 【粒子 系统 1，474 
Pascal, Blaise【〈 布 菜 斯 :帕斯卡 )，5-6 
Pascal casing 〔Pascal 样 式 )，214 
Password《〈 密 公 、 口 令 )，144 
Patent law【〔《 专 利和 法)，363-364 
PC， 风 Personal computer 
EDAS，125 
Peer-to peer (P2P) model (对 等 模型 )，160-161 
Pentium (cpu)【《 奔 膳 处理 器 )，82, 85,. 249 
Performance oriented research( 面向 性 能 的 研究 )，506, 507 
Perl，>72 
Persisent 〔(object)【〔〈 持 久 性 〔〈 对 象 ))，437 
Personal computer (PC) 〔 个 人 计算 机 )，8 
Personal 直 gital assistant 【PDA7) (个 人 数字 助理 )，8, 35 
Perspective projection 【透视 投影 )，467 
PGP， 见 pretty good Privacy 
Phishing 《电子 黑 饵 )，190 
Phong shading 【Pbong 涛 色 )，487 
Photographs of Virsual SCenes，463, 477 
PHP (scriptingz language]，272 
PHP Hypertext Processor (PHP 超 文本 处 理 器 )，180 
Physical record 〔 物 理 记 录 )，36 
Pipelining 《流水 线 )，111 
Pixel《 人 像素 )，41 
Planar Patches 《平面 )，469 
Planned obsolescence 〈 有 计划 的 淘汰 )，119 
Plato 《柏拉图 )，16 
Pocket PC，125 
Poincare, H.【 庞 加 药 )，218 
Pointer 《指针 )，377, 385, 387 
Polya, 人 【让 利 亚 )，216 
Polygonal mesh【〈 才 边 形 网 格 )，470 
Polymorphism 《多 态 )，307 
Polynomial problems【《 多 项 式 问 题 )，580 
Pop 《stack operation) 《出 栈 【 栈 操作 ))，373 
POP3， 见 Post ODffiece protocol-version，167 
Port 《IO) (IO 端口 )，105 
Port number 【并 口 号 )，185 
Post, Emil《 埃 米尔 ' 波斯 特 )，562 
Postconditions《〈 后 继 条 件 )，250 
PostScript，42 


Posttest loop 【后 测试 循环 )，227 
PowerPC ， 8 
Precedence (of operators)【 运 算 符 优 先 级 )，279 
Preconditions《proof of correctmess)【 前 气 条 件 “ 正 确 性 证 
朋 ))，249 
Predicate【〈 亩 词 )，314-315 
Pretest loop 〔 前 测试 循环 )，227 
Pretty good privacy (基于 RSA 公 钥 加 蜜 体系 的 邮件 加 密 软 
件 )，194 
Prime number (素数 1，450 
Primitive《 穆 语 )，209 
Frimitive data type〈 基 本 数据 类 型 )，274 
Print server〈 打 印 服务 器 )，159 
Privacy Act of 1974 【隐私 法 案 )，455 
Private key 【〈 秘 铀 )，193, 585 
Privilege levels《〈《 特 权 级 )，145 
Privilered instructions 【特权 指 人 对)，145 
Problem solving 问题 求解 )，216-218 
Procedural knowledge 《过程 性 知识 )，505 
Procedural models〈 过 程 模型 )，472 
Procedural paradigm【《【《 过 程 范 型 )，267 
Procedure〈 过 程 )，213, 285 
Procedure call (过 程 调用 )，285 
Procedure's header 【过 程 头 )，285 
Process【〈 进 程 )，134, 207 
Process state〈 进 程 状态 )，134 
Process switech 《进程 切换 )，136 
Process table 《进程 表 )，135, 139 
Processing unit 《neural net)〔 处 理 单元 )，533 
Production 《产生 式 )，516 
Production system 【产生 式 系统 )，516 
control system 《控制 系统 )，516 
Goal state【《 目标 状 态 )，516 
production 《产生 式 )，516 
start state 【开始 状态 )，516 
state Eraph 《状态 图 )，517 
Program【《【 程 序 )，2, 207 ， 
Program counter 【程序 计数 器 )，92 
Program unit【〔 程 序 单 元 )，213 
Programmer 【程序 员 )，300, 332-333 
Programming language【〈 程 序 设计 语言 )，209 
Programrming language cultures【〈《 程 序 设 计 语言 文化 )，281 
Programming paradigms 《程序 设计 范 型 )，267 
PROJECT 《database operation) 《投影 〔 数 据 库 操作 ))， 
十 2-230 
Projection plane〈 投 影 平面)，467 
Projectors〈 投 影 线 )，467 
Prolog，314-315 
Proof by contradiction 〔 到 证 法 )，572 
Proof of corectness (正确 性 证 明 )，249 
Proprietary network 〈 志 用 网 络 )，152 
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Protocol 【协议 )，154 

Prototyping 〈 原 型 开发 )，334-335 

Proxy server 《代理 服务 器 )，191 

Pseudocode【《 伪 代码 )，210-215 

Public key【〈 公 铀 )，193, 585 

Public-key eneryption 〔 公 钥 加 密 )，193, 585 
Push 【stack operation)〔 人 入 栈 【《 栈 操作 力 ，373 
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Quality assurance 〔 质 量 保 证 )，353-356 
Queue 〔 队 列 )，123, 373-374, 387-388 
Quick sort algorithm 《快速 排序 算法 )，234 


Radio Shack，8 

Radiosity 〔 光 能 传递 )，492 

Radix point 【小 数 点 )，49 

RAM， 见 Random access Imemory 

Random access mmemory 〔〈RAM2) 【随机 仔 储 串 )，28 

Rapid prototyping 【〈 快 速 原 型 开发 )，335 

Rasterization 〔 光 栅 化 )，483 

Rational Unified Process (RUP)( 统 一 软件 开发 过 程 ) 334 

Ravel Maurice，172 

Ray tracing 《光线 跟踪 )，490 

Reactive robot【 反 应 型 机 器 人 )，543 

Read-only memory (ROMJ) 【只 读 存 储 器 )，132 

Read operation 〈 访 操作 )，28 

Ready (〔process) 【就 绪 〈 进 程 ))，135 

Real data type 【实数 数据 关 型 )，273 

Real-time processing 《实时 处 理 )，124 
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人 入 胜 ， 极 易 引 发 读者 的 兴趣 ， 绝 无 一 般 教材 的 枯燥 和 隐 涩 。 此 外 ， 本 书 ae 

8 : 9 千 钛 傈 对 本 有 可 川 LL 人 人 

问题 供 读者 思考 和 讨论 ， 这 些 都 很 好 地 体现 了 作者 强调 培养 学 生 分 析 问题 大 学 的 计算 机 科学 学 位 项 目 ， 并 

能 力 的 教学 理念 。 在 该 校 任 教 至 今 。 他 的 主要 研究 

了 机 本 方向 是 计算 理论 。 除 了 本 书 之 外 ， 

本 书 为 最 新 的 第 10 版 ， 其 中 新 增加 了 关于 计算 机 图 形 学 的 一 章 ( 第 10 他 还 著 有 Theory or Compwfarion 

章 ) ， 这 一 章 主要 介绍 视频 游戏 和 当今 电影 产业 中 使 用 的 技术 ， 为 读者 进 Formal Languages 4utomala and 
一 步 了 解 虚 拟 现实 打下 了 基础 。 此 外 ， 这 一 版 对 组 网 及 因特网 、 软 件 工 Row 


程 、 人 工 智能 等 章节 也 做 了 大 幅 修订 ， 使 内 容 与 时 俱 进 。 

本 书 适合 各 个 学 科 以 及 不 同 教育 层次 的 读者 ， 既 适合 国内 高 等 院 校 
用 作 计算 机 基础 课 教材 ， 也 可 以 供 其 他 专业 的 读者 作为 计算 机 科学 入 门 
参考 。 


TS 日 村 他 7 昌 了 一人 全 一 于 生生 有 了 下 
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